33 results on '"Aydın Son, Yeşim"'
Search Results
2. Incorporation of Personal Single Nucleotide Polymorphism (SNP) Data into a National Level Electronic Health Record for Disease Risk Assessment, Part 3: An Evaluation of SNP Incorporated National Health Information System of Turkey for Prostate Cancer
- Author
-
Beyan, Timur and Aydın Son, Yeşim
- Subjects
Computer applications to medicine. Medical informatics ,R858-859.7 - Abstract
BackgroundA personalized medicine approach provides opportunities for predictive and preventive medicine. Using genomic, clinical, environmental, and behavioral data, the tracking and management of individual wellness is possible. A prolific way to carry this personalized approach into routine practices can be accomplished by integrating clinical interpretations of genomic variations into electronic medical records (EMRs)/electronic health records (EHRs). Today, various central EHR infrastructures have been constituted in many countries of the world, including Turkey. ObjectiveAs an initial attempt to develop a sophisticated infrastructure, we have concentrated on incorporating the personal single nucleotide polymorphism (SNP) data into the National Health Information System of Turkey (NHIS-T) for disease risk assessment, and evaluated the performance of various predictive models for prostate cancer cases. We present our work as a three part miniseries: (1) an overview of requirements, (2) the incorporation of SNP data into the NHIS-T, and (3) an evaluation of SNP data incorporated into the NHIS-T for prostate cancer. MethodsIn the third article of this miniseries, we have evaluated the proposed complementary capabilities (ie, knowledge base and end-user application) with real data. Before the evaluation phase, clinicogenomic associations about increased prostate cancer risk were extracted from knowledge sources, and published predictive genomic models assessing individual prostate cancer risk were collected. To evaluate complementary capabilities, we also gathered personal SNP data of four prostate cancer cases and fifteen controls. Using these data files, we compared various independent and model-based, prostate cancer risk assessment approaches. ResultsThrough the extraction and selection processes of SNP-prostate cancer risk associations, we collected 209 independent associations for increased risk of prostate cancer from the studied knowledge sources. Also, we gathered six cumulative models and two probabilistic models. Cumulative models and assessment of independent associations did not have impressive results. There was one of the probabilistic, model-based interpretation that was successful compared to the others. In envirobehavioral and clinical evaluations, we found that some of the comorbidities, especially, would be useful to evaluate disease risk. Even though we had a very limited dataset, a comparison of performances of different disease models and their implementation with real data as use case scenarios helped us to gain deeper insight into the proposed architecture. ConclusionsIn order to benefit from genomic variation data, existing EHR/EMR systems must be constructed with the capability of tracking and monitoring all aspects of personal health status (genomic, clinical, environmental, etc) in 24/7 situations, and also with the capability of suggesting evidence-based recommendations. A national-level, accredited knowledge base is a top requirement for improved end-user systems interpreting these parameters. Finally, categorization using similar, individual characteristics (SNP patterns, exposure history, etc) may be an effective way to predict disease risks, but this approach needs to be concretized and supported with new studies.
- Published
- 2014
- Full Text
- View/download PDF
3. Incorporation of Personal Single Nucleotide Polymorphism (SNP) Data into a National Level Electronic Health Record for Disease Risk Assessment, Part 2: The Incorporation of SNP into the National Health Information System of Turkey
- Author
-
Beyan, Timur and Aydın Son, Yeşim
- Subjects
Computer applications to medicine. Medical informatics ,R858-859.7 - Abstract
BackgroundA personalized medicine approach provides opportunities for predictive and preventive medicine. Using genomic, clinical, environmental, and behavioral data, the tracking and management of individual wellness is possible. A prolific way to carry this personalized approach into routine practices can be accomplished by integrating clinical interpretations of genomic variations into electronic medical record (EMR)s/electronic health record (EHR)s systems. Today, various central EHR infrastructures have been constituted in many countries of the world, including Turkey. ObjectiveAs an initial attempt to develop a sophisticated infrastructure, we have concentrated on incorporating the personal single nucleotide polymorphism (SNP) data into the National Health Information System of Turkey (NHIS-T) for disease risk assessment, and evaluated the performance of various predictive models for prostate cancer cases. We present our work as a miniseries containing three parts: (1) an overview of requirements, (2) the incorporation of SNP into the NHIS-T, and (3) an evaluation of SNP data incorporated into the NHIS-T for prostate cancer. MethodsFor the second article of this miniseries, we have analyzed the existing NHIS-T and proposed the possible extensional architectures. In light of the literature survey and characteristics of NHIS-T, we have proposed and argued opportunities and obstacles for a SNP incorporated NHIS-T. A prototype with complementary capabilities (knowledge base and end-user applications) for these architectures has been designed and developed. ResultsIn the proposed architectures, the clinically relevant personal SNP (CR-SNP) and clinicogenomic associations are shared between central repositories and end-users via the NHIS-T infrastructure. To produce these files, we need to develop a national level clinicogenomic knowledge base. Regarding clinicogenomic decision support, we planned to complete interpretation of these associations on the end-user applications. This approach gives us the flexibility to add/update envirobehavioral parameters and family health history that will be monitored or collected by end users. ConclusionsOur results emphasized that even though the existing NHIS-T messaging infrastructure supports the integration of SNP data and clinicogenomic association, it is critical to develop a national level, accredited knowledge base and better end-user systems for the interpretation of genomic, clinical, and envirobehavioral parameters.
- Published
- 2014
- Full Text
- View/download PDF
4. Incorporation of Personal Single Nucleotide Polymorphism (SNP) Data into a National Level Electronic Health Record for Disease Risk Assessment, Part 1: An Overview of Requirements
- Author
-
Beyan, Timur and Aydın Son, Yeşim
- Subjects
Computer applications to medicine. Medical informatics ,R858-859.7 - Abstract
BackgroundPersonalized medicine approaches provide opportunities for predictive and preventive medicine. Using genomic, clinical, environmental, and behavioral data, tracking and management of individual wellness is possible. A prolific way to carry this personalized approach into routine practices can be accomplished by integrating clinical interpretations of genomic variations into electronic medical records (EMRs)/electronic health records (EHRs). Today, various central EHR infrastructures have been constituted in many countries of the world including Turkey. ObjectiveThe objective of this study was to concentrate on incorporating the personal single nucleotide polymorphism (SNP) data into the National Health Information System of Turkey (NHIS-T) for disease risk assessment, and evaluate the performance of various predictive models for prostate cancer cases. We present our work as a miniseries containing three parts: (1) an overview of requirements, (2) the incorporation of SNP into the NHIS-T, and (3) an evaluation of SNP incorporated NHIS-T for prostate cancer. MethodsFor the first article of this miniseries, the scientific literature is reviewed and the requirements of SNP data integration into EMRs/EHRs are extracted and presented. ResultsIn the literature, basic requirements of genomic-enabled EMRs/EHRs are listed as incorporating genotype data and its clinical interpretation into EMRs/EHRs, developing accurate and accessible clinicogenomic interpretation resources (knowledge bases), interpreting and reinterpreting of variant data, and immersing of clinicogenomic information into the medical decision processes. In this section, we have analyzed these requirements under the subtitles of terminology standards, interoperability standards, clinicogenomic knowledge bases, defining clinical significance, and clinicogenomic decision support. ConclusionsIn order to integrate structured genotype and phenotype data into any system, there is a need to determine data components, terminology standards, and identifiers of clinicogenomic information. Also, we need to determine interoperability standards to share information between different information systems of stakeholders, and develop decision support capability to interpret genomic variations based on the knowledge bases via different assessment approaches.
- Published
- 2014
- Full Text
- View/download PDF
5. Assessing the readiness of Turkish health information systems for integrating genetic/genomic patient data: System architecture and available terminologies, legislative, and protection of personal data
- Author
-
Şık, Ayhan Serkan, Aydınoğlu, Arsev Umur, and Aydın Son, Yeşim
- Published
- 2021
- Full Text
- View/download PDF
6. In vitro effects of boric acid on human liver hepatoma cell line (HepG2) at the half-maximal inhibitory concentration
- Author
-
Tombuloglu, Aysegul, Copoglu, Hulya, Aydin-Son, Yesim, and Guray, N. Tulin
- Published
- 2020
- Full Text
- View/download PDF
7. Emerging Technologies in Health Information Systems: Genomics Driven Wellness Tracking and Management System (GO-WELL)
- Author
-
Beyan, Timur, Aydın Son, Yeşim, Kacprzyk, Janusz, Series editor, Bessis, Nik, editor, and Dobre, Ciprian, editor
- Published
- 2014
- Full Text
- View/download PDF
8. Emerging Technologies in Health Information Systems: Genomics Driven Wellness Tracking and Management System (GO-WELL)
- Author
-
Beyan, Timur, primary and Aydın Son, Yeşim, additional
- Published
- 2014
- Full Text
- View/download PDF
9. Selection of representative SNP sets for genome-wide association studies: a metaheuristic approach
- Author
-
Üstünkar, Gürkan, Özöğür-Akyüz, Süreyya, Weber, Gerhard W., Friedrich, Christoph M., and Aydın Son, Yeşim
- Published
- 2012
- Full Text
- View/download PDF
10. A Prostate Cancer Model Build by a Novel SVM-ID3 Hybrid Feature Selection Method Using Both Genotyping and Phenotype Data from dbGaP
- Author
-
Yücebaş, Sait Can, primary and Aydın Son, Yeşim, additional
- Published
- 2014
- Full Text
- View/download PDF
11. Selection of representative SNP sets for genome-wide association studies: a metaheuristic approach
- Author
-
Üstünkar, Gürkan, primary, Özöğür-Akyüz, Süreyya, additional, Weber, Gerhard W., additional, Friedrich, Christoph M., additional, and Aydın Son, Yeşim, additional
- Published
- 2011
- Full Text
- View/download PDF
12. Systems-level analysis of genome wide association study results for a pilot juvenile idiopathic arthritis family study.
- Author
-
Aydın-Son, Yeşim, Batu, Ezgi Deniz, Demirkaya, Erkan, Bilginer, Yelda, Kasapçopur, Özgür, Ünsal, Erbil, Alikaşifoglu, Mehmet, and Özen, Seza
- Abstract
Genome wide association studies (GWAS) determine susceptibility profiles for complex diseases. In this study, GWAS was performed in 26 patients with oligo and rheumatoid factor negative polyarticular juvenile idiopathic artritis (JIA) and their healthy parents by Affymetrix 250K SNP arrays. Biological function and pathway enrichment analysis was done. This is the first GWAS reported for JIA families from the eastern Mediterranean population. Enrichment of Fc?R-mediated phagocytosis pathway and response to various stimuli were the leading discoveries, along with the presentation of the strong interaction of JIA-associated genes with HLA cluster in the co-expression network. The co-expression network also presented the direct interaction of a gene in Fc?Rmediated phagocytosis pathway, namely GAB2, with BLK, CDH13, IL4R and MICA. The systems biology approach helped us to investigate the interactions between the identified genes and biological pathways and molecular functions, expanding our understanding of JIA pathogenesis at molecular level. [ABSTRACT FROM AUTHOR]
- Published
- 2015
13. Identification and investigation of metastasis specific miRNAs in breast cancer cells for miRNA replacement therapy
- Author
-
Ekenel, Emilia, Ergene, Emel, Aydın Son, Yeşim, and Biyoloji Ana Bilim Dalı
- Subjects
Genetics ,Genetik ,Biology ,Biyoloji ,Medical Biology ,Tıbbi Biyoloji - Abstract
Son yıllardaki çalışmalar, miRNA'nın kanser ve metastatic süreçleri düzenleyebildiğini göstermiştir. Bu çalışmanın amacı, miRNA bazlı meme kanseri tedavisinde, terapötik hedef olarak kullanılabilecek özgül metastaz baskılayıcı miRNA'ların meta-analiz yöntemi ile belirlenmiştır. Ve bu Tespit edilen üç adet özgül miRNA'ların in-vitro miRNA replasman tedavi yöntemi ile, onların terapötik potansiyelleri sunulmuştur. `Hsa-miR-145-5p`, `hsa-miR-143-3p` ve `hsa-miR-99A-5p` mimikleri, MDA-MB-231 hücrelerine transfekt edildi, bu transfeksiyon etkisinin fonksiyonel analizi için, in vitro hücre göçü deneyi uygulanmıştır. Tek bir miRNA farklı sinyal yollarında işe karışan çok sayıda genin ifadesini düzenleyebildiğinden, transfekt edilen özgül miRNA'ların metastaz yolağın üzerinde etkisi ve diğer sinyal yolaklarındaki genlerin ifadelereindeki değişimi, mikrodizi yöntemi ile araştırılmıştır. Western blot, zimogram, ve mikrodizi sonuclarındaki, seçilen bazı gen ifadelerindeki değişimi, protein düzeyinde doğrulanmıştır. Sonuçlarımız, tespit edilen üç metastatik baskılayıcı miRNA'nın her birinin, tümörgenezdeki farklı biyolojik yolları etkilediğini ortaya koymaktadır. Ayrıca, meme kanserinde `hsa-miR-145-5p`, `hsa-miR-143-3p` ve `hsa-miR-99A-5p'nin` terapötik potansiyelleri gözlenmiştir ve tümör baskılayıcı işlevleri göstermektedir.Anahtar Sözcükler: miRNA Mimik, Meme Kanseri, miRNA Transfeksiyonu, Western-Blot, miRNA Replasman Tedavi, Meta-Analiz, Metastaz. Recent studies have shown that miRNAs can regulate cancer and metastatic processes. The aim of this study was to identify specific metastasis suppressor miRNA through meta-analysis method, which can be used as a therapeutic target in miRNA-based breast cancer therapy to prevent or delay breast cancer metastasis. This study presented the therapeutic ability of the three identified metastasis suppressor miRNAs through in-vitro miRNA replacement therapy. The mimics of `hsa-miR-145-5p`, `hsa-miR-143-3p`, and `hsa-miR-99A-5p` were transfected into `MDA-MB-231` cell lines. In-vitro cell migration assay was completed for functional analysis of the effect of the replacement therapy. Additionally, since a single miRNA can regulate many genes involved in different signaling pathways, we analyzed the effect of the transfected miRNAs at the transcription level through microarray analysis. Differential expression of selected genes was validated at the protein level by western blot and zymogram. Our results suggest that each of the three metastatic suppressor miRNAs is affecting different biological pathways in tumorigenesis. Also, the therapeutic potentials of `hsa-miR-145-5p`, `hsa-miR-143-3p`, and `hsa-miR-99a-5p` in breast cancer are observed, showing the tumor-suppressive functionalities. Keywords: miRNA Mimic, Breast Cancer, miRNA Transfection, Western-Blot, miRNA Replacement Therapy, Meta-Analysis, Metastasis. 118
- Published
- 2019
14. Essential design components of genetic data enabled mobile personal health record systems
- Author
-
Özkan, Özlem, Aydın Son, Yeşim, Aydınoğlu, Arsev Umur, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Bilim ve Teknoloji ,Information security ,Science and Technology ,Right of privacy and its protection - Abstract
Genetik testlerin sağlık alanında kullanımındaki hızlı artış, elektronik sağlık kayıtlarının genetik/genomik verileri kapsaması için yeniden tasarlanması konusunda yeni bir tartışma başlatmıştır. Bugün genetik veriler, sıradan sağlık kayıtlarıyla aynı şekilde değerlendiriliyor. Fakat, genetik verilerin gizlilik ve güvenlik konusunda endişeleri arttıran, kendisine has birçok özelliği ve hatta birçok ülkede uygulanan, genetik veriye özel yasa ve regülasyonlar var. Biz genetik verinin yönetimi için, veri sahibine kendi verisi üzerinde tam kontrol vererek gizlilik ve güvenlik endişelerini giderebilecek potansiyele sahip olduğundan Kişisel Sağlık Kayıtları (PHR) sistemlerini öneriyoruz. Bu nedenle de, bu tez kapsamında, genetik/genomik verileri içeren bir mobil PHR'nin temel tasarım bileşenlerini belirlemek için, dört farklı alt çalışma düzenledik. Uygulama marketlerinde bulunan mevcut mobil PHR uygulamaları değerlendirildi ve eksikliklerini tespit edildi. İkinci çalışma olarak, bu analiz sonuçları baz alınarak, halkın endişe ve görüşlerine ulaşmak için, bir anket geliştirildi ve yarısı genetik test deneyimleri olan 174 kişiye uygulandı. Üçüncü çalışmada, beş katılımcı ile birlikte 11 katılımcı yaklaşımlı tasarım oturumu organize edildi ve toplantıların sonucunda genetik verilerin bulunduğu örnek bir mPHR prototipi tasarlandı. Son olarak, 18 uzmanın katılımıyla, genetik verilerin toplanması ve Türk sağlık bilgi sistemlerinde gizlilik konularında iki odak grup çalışması organize edildi. Tüm bu çalışmaların sonucu olarak, genetik verileri de içeren bir mPHR'nin karakteristik özellikleri ve gereksinimleri belirlendi. The rapid growth in the use of genetic tests in healthcare has opened a new discussion on the redesign of electronic health records to cover genetic/genomic data. Today, this information is treated in the same way as ordinary health data. However, genetic data has many unique properties that raise concerns about privacy and security issues. Moreover, in many countries, there are specific laws and regulations to protect genetic/genomic data. We recommend PHR systems for this purpose since they are under the full control of the owner and thus have a great potential to address privacy concerns. Therefore, we carried out four sub-studies in order to identify critical design issues of genetic data-enabled mPHRs in the scope of this dissertation. First, current mPHRs available in application markets were evaluated to see what was included in existing applications and to identify the missing aspects. Second, with the help of the mPHR analysis results, a survey was developed and administered to174 people, half of whom had genetic test experiences, to assess the public's concerns and views on genetic data being included in the mPHR. Third, 11 participatory design sessions with five participants were held. At the end of the meetings, a sample paper prototype of genetic data included in the mPHR was developed. Lastly, two focus group studies on the collection of genetic data and confidentiality of Turkish health information systems were organized with 18 experts. As a result of these studies, characteristics and necessities of a genetic data-enabled mPHR were determined. 161
- Published
- 2018
15. Optimization of weights and features in use of ahp for SNP prioritization
- Author
-
Yilmaz, Arif, Aydın Son, Yeşim, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Biyomühendislik ,Moleküler Tıp ,Bilim ve Teknoloji ,Molecular Medicine ,Bioengineering ,Science and Technology - Abstract
Tekil Nükleotid Polimorfizmleri (SNP), kanser ya da tip 2 diyabet gibi karmaşık hastalıkların tespitinde umut vadetmektedir. Bununla birlikte karmaşık hastalıklarla ilişkili SNP'lerin tespit edilmesi bireylerin genomlarındaki çok sayıdaki ve değişkenlikteki SNP'ler nedeniyle zorlayıcı bir problemdir. SNP veri setlerinin genom çapında ilişkilendirme çalışmalarında çoğunlukla istatistiksel bulgular üzerinde odaklanılmaktadır. Bununla birlikte, bir insan genomunda yaklaşık yüz milyon SNP bulunmaktadır. İstatistiksel olarak anlamlı SNP'lerle ilgili biyolojik ve işlevsel bilgilerin eklenmesi daha ileri SNP seçimi için önemli özellikler sağlamaktadır. Analitik Hiyerarşi İşleme (AHİ) temelli SNP önceliklendirme tekniği bu görevi yerine getirmek amacıyla geliştirilmiştir. Fakat AHİ'nin uzmanların deneyimlerine ihtiyaç duyması özniteliklerin seçiminde ve ağırlıklarında öznel kararlara neden olmaktadır. Bu çalışmada AHİ tasarımı ve eniyilemesi için Rastgele Orman tabanlı AHİ (RO-AHİ) kategorilerinin ağırlık ve öznitelik belirleme yaklaşımı önerilmektedir. Bu amaçla Prostat Kanseri üzerinde daha önceden yapılmış olan çalışmalar sonucunda geliştirilmiş olan genomik model kullanılmıştır. Geliştirilen yöntem, Şizofreni, Prostat kanseri, Tip 2 Diyabet ve Alzheimer Hastalığı genetik veri setlerinde Delphi AHİ tabanlı bir yöntem ile karşılaştırılmış ve aynı başarıma ulaşılabilmiştir. Ek olarak, RegulomeDB veritabanı da RO-AHİ ye eklendiğinde Şizofreni hastalığı ile ilgili daha iyi sonuçlara ulaşılmış, diğer hastalıklar ile ilgili aynı başarım sonuçlarına ulaşılmıştır. Single Nucleotide Polymorphisms (SNP) holds a promise in identification of genomic footprints of complex diseases such as cancer and diabetes. However identification of SNPs associated to complex diseases is a challenging problem due to the high number and variety of SNPs present in individual genomes. Analysis of genome wide studies of SNP datasets mainly focus on statistical evidence. As there are close to hundred million SNPs in human genome, incorporating biological and functional knowledge about statistically significant SNPs provides valuable features for further selection of SNPs. Analytical Hierarchy Process (AHP) based SNP prioritization approach is a method developed for this purpose. However, AHP requires expert knowledge, which results in subjective decisions. In this work, we propose a novel approach for AHP design and optimization by utilizing Random Forest based AHP (RF-AHP) assessment on categories. We utilized the results of previously developed genomic model on Prostate Cancer. Proposed RF-AHP approach was compared with Delphi-AHP based method on Schizophrenia, Prostate Cancer, Type 2 Diabetes and Alzheimer's disease genomic datasets and same performance was achieved. Additionally, RegulomeDB database was integrated to RF-AHP. While similar performance was obtained in most of the datasets better prioritization scoring is achieved for Schizophrenia disease. 129
- Published
- 2018
16. Genomic modelling of bipolar disorders: Comparison of multifactor dimension reduction and classification-based data mining methods
- Author
-
Açikel, Cengizhan, Aydın Son, Yeşim, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Medical informatics ,Genetics ,Genetik ,Computer aided decision making - Abstract
Genomik modellemede; farklı veri madenciliği yöntemleri, değişken başarılar ile genom boyu ilişkilendirme çalışmaları ile elde edilen çok katmanlı verileri analiz etmede kullanılmaktadırlar. Bu çalışmada; çok faktörlü boyut indirgeme (MDR) (tek nükleotid polimorfizimleri (SNP) veya genler arasındaki etkileşimleri de inceleyen bir non-parametrik yöntem) ile sınıflama tabanlı üç veri madenciliği yönteminin, bipolar bozukluk genomik modellerinde, karşılaştırılması amaçlanmıştır. Bu çalışma Bipolar Bozukluklar Tüm Genom Asosyasyon Çalışması (dbGaP Numarası: phs000017.v3.p1) verisi ile yapılmıştır. Sınıflama temelli 3 veri madenciliği yöntemi (Random Forest [RF], Naïve Bayes [NB] and k-Nearest Neighborhood [kNN]) ve MDR kullanılmıştır. Ayrıca saptanan ortak SNP'ler için pathway analizleri yapılmış ve yorumlanmıştır. RF, NB, ve kNN sırasıyla 16, 13, ve 10 aday SNP saptamıştır. Üç yöntemin belirlediği ilk altı SNP ortaktır. RF ve kNN, 0.95 üzerindeki recall değerleri ile, NB'e gore daha başarılı sonuçlar vermiştir. Diğer yandan MDR, iki ve üç yönlü etkileşim ile, sadece 5 SNP ile karşılaştırılabilir kestirim gücüne sahip bir model üretmiştir. MDR ile saptanan SNP'ler sınıflama tabanlı diğer üç modelden farklı olmasına karşın tüm modellerde polimorfizmlerin ZNF507 ve DOCK10 genlerine haritalandıkları saptanmıştır. Sadece farklı 5 SNP saptayan MDR'ın aksine, üç sınıflama tabanlı veri madenciliği yaklaşımı, RF, NB ve kNN, bipolar bozukluk kestiricisi olarak benzer SNP polimorfizmlerini önceliklendirmişlerdir. Sınıflama performansını düşürmeksizin, daha az sayıda SNP ile kestirim yapmak bipolar bozuklukların arkasındaki moleküler mekanizmanın anlaşılmasını ve tanı araçlarının validasyon çalışmalarını kolaylaştırmaktadır. Bununla birlikte genomik modellerin kliniğe geçişinin daha yüksek sınıflandırma performansına sahip modeller gerektirdiği belirtilmelidir. In genomic modeling, various data mining techniques are proposed with varying degrees of success to analyze high-dimensional data generated by genome-wide association studies of complex genetic disorders. In this study, we aimed to compare Multifactor Dimensionality Reduction (MDR), a non-parametric approach that can be used to detect relevant interactions between Single Nucleotide Polymorphisms (SNPs) or genes, with 3 other classification based data mining methods for genomic modeling of bipolar disorders. This study was performed on a Whole Genome Association Study of Bipolar Disorders (dbGaP Number: phs000017.v3.p1) data. Three classification based data mining methods (Random Forest [RF], Naïve Bayes [NB] and k-Nearest Neighborhood [kNN]) and MDR were performed. Pathway analysis, based on identified common SNPs is also performed, and evaluated. RF, NB, and kNN identified 16, 13, and 10 candidate SNPs, respectively. The top six SNPs were common to all three. The RF and kNN models were found to be more successful than the NB model, with recall values above 0.95. On the other hand, MDR generated a model with comparable predictive performance based on five SNPs identified by analysis of two-way and three-way interactions. Although a different SNP profile is identified in MDR compared to the other three classification-based models, all models identified SNPs mapping to the ZNF507 and DOCK10 genes. Three classification-based data mining approaches, RF, NB and kNN, have prioritized similar SNP profiles as predictors of bipolar disorders, in contrast to MDR, which reported a different set, which includes only five SNPs. The reduced number of SNPs, without loss in the classification performance, has the potential to facilitate validation studies to understand the molecular mechanisms behind bipolar disorders and molecular diagnostics tools. Nevertheless, we emphasize that translation of genomic models to the clinic require models with higher levels of classification performance. 123
- Published
- 2017
17. Investigation of the in vitro cytotoxic effects of boron on human hepatocellular carcinoma cell line, HepG2
- Author
-
Çöpoğlu, Hülya, Güray, Nülüfer Tülün, Aydın Son, Yeşim, and Moleküler Biyoloji ve Genetik Anabilim Dalı
- Subjects
Genetics ,Genetik ,Biology ,Biyoloji - Abstract
Bor, yerkabuğunda bulunan yaygın bir elementtir. Bitkiler için gerekli olan mikro besin maddesidir ve hayvanlar için faydalıdır. Yüksek konsantrasyonlarda borların hücreler üzerinde toksik etkileri olduğu bilinmektedir ve halen bu toksisite mekanizması belgelenmemiştir. Karaciğer, böbrek, merkezi sinir sistemi ve gastrointestinal yol en etkili organlardır. İnsanlar çoğunlukla bora boratlar veya borik asit olarak maruz kalırlar. Maruz kalma, tipik olarak, bor bileşikleri içeren pestisitlerin kullanımı, bor içeren toz ve tozların inhalasyonu yoluyla veya kozmetik ürünlerden veya tıbbi preparatlardan bor kullanımı yoluyla, yiyecek veya içilen su yoluyla oluşur. Bor, karaciğerde borik asite metabolize olur ve bu da karaciğerde ve biriken dışkı sistem organlarında birikir.Bu çalışmada hepatocellular karsinom HepG2 hücrelerinde borik asit metabolizması ve toksisitesini inceledik. Toksik konsantrasyonun eşiğini bulmak için HepG2 hücreleri 24 saat boyunca 0,5-40 mM borik asit ile muamele edildi ve IC50 değeri 24 mM olarak hesaplandı. Bu konsantrasyonda, tek hücre jel elektroforezi (Comet testi) ve sitokin blok mikronükleus tahlili (CBMN) ile DNA parçalanması ve mikronukleus oluşumunda belirgin bir artış gözlendi. Genotoksisite sonuçları, DNA hasarının borik asit toksisitesi mekanizmasına katıldığını, ayrıca hücre canlılığı testinin sonuçlarına da, hücre canlılığının borik asit tarafından doza bağımlı şekilde inhibe edildiğini ortaya koymuştur.Gen ekspresyon analizi, Affymetrix Gene Chip Human Gene 1.0 ST Array platformları kullanılarak gerçekleştirilir. IC50 konsantrasyonu maruziyetindeki borik asit, 828 genin ekspresyonunu önemli ölçüde değiştirdi, 467 aşağı regüle edildi ve 361 yukarı regüle edildi. Düzenlenen genlerin biyolojik yorumları için DAVID veritabanı kullanıldı.Yolak analiz sonuçları, borik asit maruziyeti ile değişen yolakların özellikle hücre döngüsü, DNA replikasyonu ve steroid biyosentez yolakları olduğunu ortaya koydu. Genel olarak, toksik konsantrasyonlarda borik aside maruz kalmanın, hücre döngüsü, DNA replikasyonu ve steroid biyosentezinde rol oynayan genlerin düzenlenmesini etkileyerek DNA hasarına yol açtığını göstermiştir. Memeli hücrelerinde borik asit toksisitesinin moleküler mekanizmalarını anlamak için, çalışmada tanımlanan farklı olarak düzenlenen genlerin daha fazla araştırılması planlanmaktadır.Anahtar Kelimeler: Borik asit, mikroarray analizi, sitotoksisite, genotoksisite, HepG2 hücre hattı. Boron is a widely available element found in the earth's crust. It is an essential micronutrient for plants and it is also beneficial for animals. At high concentrations boron is known to have toxic effects on cells, and currently the mechanism of this toxicity is still not documented. Liver, kidney, central nervous system, and gastrointestinal track were the most effected organs. Humans mostly exposure to boron as borates or boric acid. The exposure typically occurs through ingestion of food or water, through use of pesticides containing boron compounds, inhalation of boron-containing powders and dusts, or use of boron from cosmetics or medical preparations. Boron is metabolized into boric acid in the liver, which accumulates mainly in the liver, and in the excretory system organs. In this study we examined the boric acid metabolism and toxicity in hepatocellular carcinoma, HepG2 cells. In order to find the threshold for the toxic concentration HepG2 cells were treated between 0,5-40 mM of boric acid for 24 h and IC50 value was calculated as 24 mM. At this concentration, significant increase in DNA fragmentation and micronucleus formation were observed with single cell gel electrophoresis (Comet assay) and cytokines block micronucleus assay (CBMN). The genotoxicity results indicated that the DNA damage participated in the mechanism of boric acid toxicity, also the results of cell survival assay also revealed that, the cell viability were significantly inhibited by boric acid in a dose dependent manner. Gene expression analysis is performed by using Affymetrix Gene Chip Human Gene 1.0 ST Array platforms. Boric acid at IC50 concentration exposure significantly altered the expression of 828 genes in total, 467 were down-regulated and 361 were up-regulated. Database for Annotation, Visualization and the Integrated Discovery (DAVID) is used for the annotation and biological interpretations of the regulated genes. Pathway Analysis revealed that, the top networks that are altered by acute exposure of boric acid were cell cycle, the DNA replication and the steroid biosynthesis networks. Overall we have shown that at toxic concentrations exposure to boric acid results in DNA damage, effecting the regulation of genes that have role in cell cycle, DNA replication, and steroid biosynthesis. Further investigation of the differentially regulated genes identified in the study is planned for understanding the molecular mechanisms of boric acid toxicity in mammalian cells.Keywords: Boric acid, microarray analysis, cytotoxicity, genotoxicity, HepG2 cell line. 107
- Published
- 2017
18. Reconstruction of the temporal signaling network in salmonella-infected human cells
- Author
-
Budak, Güngör, Aydın Son, Yeşim, Tunçbağ, Nurcan, and Biyoenformatik Anabilim Dalı
- Subjects
Salmonella infections ,İstatistik ,Statistics ,Biology ,Biyoloji ,Computer Engineering and Computer Science and Control ,Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol - Abstract
Salmonella enterica, enfeksiyon mekanizması genellikle yiyecek kaynakları yoluyla olan bir bakteriyel patojendir. Patojen proteinleri, konak hücrelere konağın sinyal mekanizmalarını ve konak proteinlerini etkinleştirerek ya da engelleyerek değiştirmek üzere taşınır. Enfekte insan hücrelerindeki biyolojik yolakların ve zamana bağlı sinyal ağlarının daha bütün olarak yeniden kurulması için, Salmonella ile enfekte olmuş insan hücrelerinin zamana bağlı fosfoproteomik veriseti ile insan etkileşim haritası birleştirilerek, Ödül-toplayan Steiner Orman (ÖTSO) ve Tam Sayı Doğrusal Programlama (TSDP) temelli ilişki çıkarım yaklaşımları kullanıldı. Elde edilen zamana bağlı sinyal ağı, zaman ve yön bilgisini korurken SNARE bağlanma, mTOR sinyali, bağışıklık tepkisi, hücre iskeleti organizasyonu ve apoptoz yolakları gibi sinyallerdeki gizli fonksiyonları gösterdi. CDC42, RHOA, 14-3-3δ, Syntaxin ailesi, Oxysterol bağlanma proteinler gibi Salmonella etkileyicilerinin hedefleri fosfoproteomik verisetinde olmamasına rağmen, bu proteinler yeniden kurulan sinyal ağında ortaya çıktı. Bu hedeflerin yapısal analizi, komşularının bağlanma eğilimlerini gösterdi. Bu gibi birleştirilmiş yaklaşımların uygulaması, özellikle Salmonella enfeksiyonları olmak üzere, bulaşıcı hastalıklardaki klinik hedeflerin tanımlanmasında yüksek potansiyele sahiptir. Salmonella enterica is a bacterial pathogen whose mechanism of infection is usually through food sources. The pathogen proteins are translocated into the host cells to change the host signaling mechanisms either by activating or inhibiting the host proteins. In order to obtain a more complete view of the biological processes and the signaling networks and to reconstruct the temporal signaling network of the human host, we have used two network modeling approaches, the Prize-collecting Steiner Forest (PCSF) approach and the Integer Linear Programming (ILP) based edge inference approach by integrating a published temporal phosphoproteomic dataset of Salmonella-infected human cells and the human interactome. The final temporal signaling network conserves the information about temporality and directionality, while showing hidden entities in the signaling, such as the SNARE binding, mTOR signaling, immune response, cytoskeleton organization, and apoptosis pathways. Although the targets of Salmonella effectors such as CDC42, RHOA, 14-3-3δ, Syntaxin family, Oxysterol-binding proteins were not present in the phosphoproteomic dataset, they were revealed in the reconstructed signaling network. Structural analysis of these targets also revealed binding preferences of their neighbors. The application of such integrated approaches has a high potential to identify the clinical targets in infectious diseases, especially in the Salmonella infections. 71
- Published
- 2016
19. Investigating the role of RNA-binding proteins (RBPs) in explaining differential gene expression in cancer
- Author
-
Lafzi, Atefeh, Aydın Son, Yeşim, Kazan, Hilal, and Biyoenformatik Anabilim Dalı
- Subjects
Biyomühendislik ,Micro RNA ,Biyoistatistik ,RNA-messenger ,Bioengineering ,RNA binding proteins ,Biostatistics ,Biyoteknoloji ,Biotechnology - Abstract
Kansere yol açan etmenleri bulmayı amaçlayan çalışmalar özellikle kanserli ve normal hücreler arasında farklı ifadesi olan genlerin regülasyonunu incelemektedir. Şu ana kadarki çalışmaların büyük bir kısmı sadece transkripsiyonel kontrolle ilgili etmenleri dikkate alarak bu ifade değişimlerini açıklamaya çalışmıştır. Son çalışmalar, transkripsiyon sonrası kontrolün (TSK) de gen ifadelelerini kontrol eden önemli bir mekanizma olduğunu göstermiştir. Transkripsiyon sonrası kontrol RNA-ya bağlanan proteinler (RBP) ve miRNAların hedef genlere bağlanmasıyla gerçekleştirilmektedir. Bu tez kapsamında, ifadesi değişen RBPlerin sayısının en fazla olduğu LUSC (akciğer sküamoz karsinomu) kanserinde, kanserde ölçülen gen ifadelerini, gen kopya sayıları, DNA metilasyonu, transkripsiyon faktörleri, miRNAları ve RBPlerin etkilerini göz önüne alarak tahmin eden bir istatistiksel model geliştirildi. Diğer özniteliklere ek olarak RBPlerin kullanılması bu modelle tahmin edilen ifadelerle bilinen gen ifadeleri arasındaki Spearman korelasyonunu önemli ölçüde arttırdı. Öznitelik seçimiyle LUSCde önemli rol oynayan RBler bulunmuş ve bu RBPlerin ifadelerinin değişim gösterdiği tespit edilmiştir. Modelde öğrenilen parametreler incelenerek bu RBPlerin hedefleri bulunmuş ve CLIP-deneyiyle bulunan hedeflerle karşılaştırılmıştır. Son olarak Kaplan-Meier analizi ile bu RBPlerin bazılarının kurtulma olasılığını tahmin edebildiği bulunmuştur. Bu sonuçlar kanserde gen ifade değişimlerinin daha iyi anlaşılması için RBPlerin de göz önüne alınması gerektiğini göstermektededir. Most of the studies on cancer have tried to explain the observed differential gene expression considering only transcriptional regulation. However, post-transcriptional regulation (PTR) has been increasingly recognized as a complex mechanism that also controls various steps of gene expression regulation. Post-transcritional regulation is governed by the interactions of RNA-binding proteins (RBPs) and microRNAs (miRNAs) with their target genes. In this thesis, having found that several RBPs are differentially expressed in Lung squamous cell carcinoma (LUSC), we developed a statistical model which incorporates copy number variation, DNA Methylation and the regulatory effects of transcription factors, miRNAs and RBPs to predict gene expression in cancer. Including RBP-based regulation in addition to other features significantly increased the Spearman rank correlation between predicted and measured expression of held-out genes. Using a feature selection procedure we identified the candidate RBP regulators in LUSC and confirmed that many of them are also differentially expressed. We also determined the targets of these RBPs and compared them with CLIP-determined targets. Lastly, we performed Kaplan-Meier survival analysis, and showed that some of our candidate RBP regulators have prognostic power in LUSC. Our results suggest that the regulatory effects of RBPs have to be considered to explain differential gene expression in cancer. 66
- Published
- 2016
20. Modeling the combined effect of RNA-binding proteins and micrornas in post-transcriptional regulation
- Author
-
Hafezqorani, Saber, Aydın Son, Yeşim, Kazan, Hilal, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Micro RNA ,Biyoistatistik ,RNA-messenger ,Biostatistics - Abstract
Transkripsiyon-sonrası kontrol (TSK), gen ifadesinin transkripsiyon ile translasyon arasındaki adımlarını kontrol eder. Bu adımların kontrolü RNA'ya bağlanan protein (RBP) ve mikroRNA'ların (miRNA) mesajcı RNA'lardaki (mRNA) hedef noktalarına bağlanmaları sayesinde gerçekleştirilir. Şu ana kadar yapılan çalışmaların büyük çoğunluğunda tek bir RBP ya da tek bir miRNA aynı mRNA'ya bağlanan diğer faktörlerden bağımsız olarak incelenmiştir. Ancak, son çalışmalar RBP ve miRNA'ların birbirleriyle işbirliği ya da rekabet ilişkileri içerisinde olduklarını göstermiştir. Bu tezde, son gelişmelere paralel olarak insan 3'UTR'ları üzerindeki hem RBP, hem de miRNA bağlanma noktalarını belirledik. İlk olarak, üzerinde çalışılmış RBP'lerin deneysel yöntemlerle bulunan bağlanma noktaları ile işlemsel yöntemlerle tahmin edilmiş bağlanma noktalarını RNA'nın ikincil yapısı ve evrimsel korunum bakımından farklı olduğunu gösterdik. Daha sonra, HuR adlı RBP için var olan susturulma sonrası mRNA ifade değişimi verilerini kullanarak diğer faktörlerin HuR'la olan rekabetçi ilişkilerini araştırdık. Ayrıca, iki faktörün (RBP ya da miRNA) bağlanma noktalarının beraber görülme sıklığını hesaplayarak potansiyel işbirliği ilişkilerini inceledik. Bu analiz sonucunda PUM1 ve PUM2 RBP'lerinin miRNA'larla işbirliği içerisinde olduğunu gözlemledik. Son olarak, faktör bağlanma sayıları ve dinükleotid frekansı gibi öznitelikleri bağlanım modeliyle kullanarak gen ifadesi ve stabilitesini yüksek bir doğruluk payıyla tahmin ettik. Elde ettiğimiz sonuçlar transkripsiyon-sonrası kontrol ile ilgili mekanizmaları daha iyi anlamak için RBP'lerin, miRNA'ların ve ayrıca aralarındaki ilişkilerin de göz önünde bulundurulması gerektiğine işaret etmektedir. Post-transcriptional regulation (PTR) controls the gene expression between transcription and translation. Regulation at this level is carried out by the interactions of trans-acting RNA-binding proteins (RBPs) and microRNAs (miRNAs) with cis-regulatory elements in mRNA. Majority of previous work have focused on the effect of a single factor independent of other co-factors bound to the same mRNA. However, recent studies have shown that RBPs and miRNAs can act in cooperation or competition with each other. In this thesis, we mapped the binding sites of both RBPs and miRNAs on human 3'UTRs, and utilized this collection of binding sites to better understand PTR networks. We first focused on several RBPs and assessed how accessibility and conservation differ between experimentally supported sites and other sites that are only computationally predicted. We then investigated the competitive effects of other factors on HuR binding and the resulting transcript abundance change upon HuR depletion. Next, we characterized the potential interactions between the factors by finding those pairs of factors with co-occurrence of motifs higher than expected by chance. Our results show that PUM1 and PUM2 have potential cooperative interactions with miRNAs. Finally, we used logistic regression with features compiled from the counts of sites of factors and dinucleotide frequency to accurately predict the stability and steady-state abundance of mRNAs. Altogether, results of this thesis suggest that studies of PTR must consider the effect of both RBPs and miRNAs, and their interactions. 103
- Published
- 2015
21. Single nucleotide polymorphism (SNP) data integrated electronic health record (EHR) for personalized medicine
- Author
-
Beyan, Timur, Aydın Son, Yeşim, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Computer Engineering and Computer Science and Control ,Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol - Abstract
Sayısal çağ, eski ve tarihsel topluma dayalı tıbbi bakım paradigmasını kişiselleştirilmiş tıbba doğru devrimsel şekilde dönüştürmektedir. Geleneksel tanısal yaklaşımlar tedaviye tepki ve prognozu tanımlamada başarısız kalmaktadır. Apaçık belirtilere odaklanmak sıkça risk faktörlerini gizlemekte ve böylece hastalıkları önleme fırsatları gözden kaybolmaktadır. Bugün bilinmektedir ki, karmaşık hastalıkların çoğu genomik, çevresel ve davranışsal faktörlerin etkileşimi ile ortaya çıkmaktadır ve kişiselleştirilmiş tıp bu tür verilerin bireysel hastalık örüntülerini belirlemek üzere kullanımı olarak tanımlanmaktadır. Kişiselleştirilmiş tıp, tıbbi durumların daha doğru bir görünümünü yani kişi merkezli, çok boyutlu, öngörücü, önleyici, farmakolojik olarak etkin ve bireysel hizmetleri sunmaktadır. Bununla beraber, kişiselleştirilmiş tıp fırsatlarına erişmek için, güncel ESK standart ve yeteneklerini tıbbi bakım ortamlarında genomik veriyi destekleyecek şekilde genişletmek bir zorunluluktur. Bu tezde, bilgiye dayalı sistemleri desteklemek üzere, elektronik/kişisel sağlık kayıtlarında bütünsel genom TNP profilleme verisi ve hastalık modellerini kullanmaya izin verecek bütünleşik bir yaklaşıma dayalı kişiselleştirilmiş tıp uygulamaları için TNP verisi bütünleşik yetenekler geliştirdik. Sonunda, geliştirilen yetenekler pilot bir araştırma olarak prostat kanseri için bir veri setinde sunulmuş ve değerlendirilmiştir. The digital age is revolutionizing the old and historical population-based healthcare paradigm towards personalized medicine. Traditional diagnostic approaches fail to define treatment response or prognosis. Focusing on manifest symptoms often hides risk factors and, so prevention opportunities of diseases disappear. Today, it's known that most of the complex diseases are result of interaction of genomic, environmental and behavioral factors and personalized medicine is defined as the use of these data to determine individual patterns of disease. Personalized medicine aims to deliver a more accurate representation of medical conditions that are multidimensional, predictive, preventive, pharmacologically effective, personcentered, and individualistic services. However, to reach personalized medicine opportunities, it's an obligation to extend current Electronic Health Record standards and capabilities to support genomic data in healthcare settings. In this thesis, we developed genomic sequence variation data integrated capabilities for personalized medicine practices based on an integrative approach which will allow us to use genome-wide SNP profiling data and disease models within electronic/personal health records to support knowledge based systems. Finally, developed capabilities were represented and assessed for prostate cancer in a data set as a pilot study. 233
- Published
- 2014
22. Integration of metu-snp databases via rdf for pi-snp web service
- Author
-
Gedikoğlu, Ceyhun, Aydın Son, Yeşim, Çarkacıoğlu, Levent, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Genetics ,Genetik ,Computer Engineering and Computer Science and Control ,Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol - Abstract
Tek nükleotit polimorfizmi bir türün elemanları veya bir insanın DNA sekansındaki eşlenmiş kromozomları arasındaki bir nükleotid mutasyonu sonrasındaki çeşitliliktir. SNP verisi komplike hastalıkların temelinde yatan genetik çeşitlilikleri tanımlamak için özellikle önemlidir. Bu verinin toplanması, servisi için ihtiyaç ve standart bir format altında, küresel normalize edilmiş ve biçimlendirilmiş SNP verisine evsahipliği yapan kılavuz bilgi zamanla daha önemli bir hal almaktadır. Öte yandan yüksek hızlı genotip teknolojilerindeki ilerlemeler büyük kapasiteli veri birikimlerine öncü olmaktadır. Bu demek oluyor ki, her yeni araştırma yeni veriler sağlayacaktır ve hesaplamalarımız için bu yeni verilere ihtiyacımız var. Çevrimdışı bir veritabanı güncel bilgiyi kaçırmamıza neden olabilir. Bu yüzden, entegre edilmiş, düzenli güncellenen otomatize edilmiş veritabanıyla iSNPi oluşturduk. iSNP oluşturduğu SNP ve ilgili verileri halka açık uygun veritabanlarından standart biçimlendirilmiş bir halde farklı uygulamalar tarafından kullanılabilecek bir şekilde çekmektedir. Ayrıca METU-SNP masaüstü uygulamasının iSNP veritabanıyla da desteklenecek şekilde web ortamına entegre edilmesi çalışmalarımızın bir parçasını oluşturuyor. Bu çalışma dünyanın her tarafından araştırmacıların METU-SNP uygulamasına, güncel bilgiyi kullanarak erişmesine olanak sağlayacaktır. Single Nucleotide Polymorphism (SNP) is a variation which occurs after a nucleotide mutates between members of a species or paired chromosomes in DNA sequence. SNP data is especially important for identifying genetic variations underlying complex diseases. The need for collection and service of this data under a standard format and globally normalized and structured metadata that houses the structured SNP data is becoming more important while recent advances in high-throughput genotyping technologies are resulting in data accumulation at large scales. This means every new research can result with new data and we need all the new data for our computations. Offline databases can only offer a collection of data but cannot provide access to updated information. So we have built an integrated (iSNP) database that is a regularly updated. This machine curated database that holds SNP and its associated metadata from publicly available databases under a structured standard format can be efficiently utilized within different applications. Also the adaptation of the METU-SNP desktop application(SNP prioritization tool for complex diseases) to the web environment, which is supported by the iSNP database is included as a part of the study. This study will help bioinformaticians from all over the world reach the METU-SNP application with the upto date SNP information used in it via web environment. 67
- Published
- 2014
23. Cytokine polymorphism catalog (CytoCAT) for the analysis of phenotype associations
- Author
-
Oğuz, Gökçe, Acar, Aybar Can, Aydın Son, Yeşim, and Tıp Bilişimi Anabilim Dalı
- Subjects
Biology ,Biyoloji - Abstract
Currently, many studies focus on identifying disease related biological biomarkers for prediction of susceptibility, early detection, and prevention, in addition to developing new therapeutic approaches. In our study, we have investigated the single nucleotide polymorphisms (SNPs) of human cytokines and cytokine receptors, which play an important role in the immune system, as potential disease biomarkers and focused on phenotypes as they might give clue about disease symptoms. Our main aim was to create a catalog to be a guideline to early diagnosis, disease treatment, and drug discovery and design studies by storing general and specific associations between genes, SNPs and phenotypes. For that reason, firstly genetic variations on known human cytokines and cytokine receptors and then associations between these variations and phenotypes are identified. In particular, the data integration approaches were used to map single nucleotide polymorphisms (SNPs) on known cytokine and cytokine receptor genes and to extract SNPs associated to phenotypes from various biological databases. By congregating these data a new biological relational database was developed. A case study is done to further analyze and visualize the GWAS results for 3 different cancer types accessed through database of Genotypes and Phenotypes (dbGaP). This relational database enables one to search with different parameters and to analyze the associations from different aspects. As a result, a catalog of cytokine and cytokine receptor SNPs and their association with diseases is developed. This allows analysis of molecular and clinical research data from different perspectives, like identifying underlying etiology of diseases through associated polymorphisms, and SNPs common to cytokine-dependent diseases. Son yapılan araştırmalar hastalığın tedavisinin yanı sıra önceden teşhis edebilmeye de odaklanmaktadır. Hastalık ön teşhisinde kullanılan çeşitli yöntemlerden biri de moleküler biyomarkerlar kullanarak hastalığa sebep olan genetik bozuklukları belirlemektedir. Bu çalışmada bağışıklık sisteminde çok önemli rol oynayan sitokinler ve sitokin reseptörleri genlerinde ortaya çıkan tek nükleotid polimorfizmleri(SNPler) potansiyel hastalık biyomarkerı olarak kullanıldı ve hastalık belirtilerine dair ipucu verebileceğinden dolayı fenotiplere odaklanıldı. Bu çalışmanın esas amacı erken teşhis, hastalık tedavisi ve ilaç keşfi ve tasarımı çalışmalarına gen, SNP ve fenotip arasındaki genel ve özel ilişkileri sunarak yardımcı olacak bir katalog geliştirmekti. Bundan dolayı öncelikle sitokin ve sitokin reseptörleri genlerinde bulunan SNPler ardından da bu SNPlerle fenotipler arasındaki ilişkiler tanımlandı. Bu çalışma için veri entegrasyonu yöntemleri kullanılarak, insan sitokinlerinin ve reseptörlerinin genlerinde meydana gelen tek nükleotid polimorfizmleri ve hastalıklara sebep olan tek nükleotid polimorfizmleri farklı biyolojik veritabanlarından edinildi ve bu bilgiler doğrultusunda yeni bir biyolojik veritabanı oluşturuldu. dbGaP sitesinden edinilen 3 farklı kanser tipiyle örnek çalışma yapıldı. Bu yeni veritabanı sayesinde kullanıcılar farklı parametrelerle araştırma ve farklı açılardan gen-hastalık ilişkileri analiz etme olanağı bulacaklar. Sonuç olarak en çok hastalığa sebep olan genler ve polimorfizmleri, farklı hastalıklardaki ortak mutasyonların bilgisini de içeren sitokin ve sitokin reseptörleri genlerindeki SNPlerin ve bunların hastalıklara ilişkininin kataloğu oluşturuldu. 102
- Published
- 2014
24. Investigation of structural properties of methylated human promoter regions in terms of DNA helical rise
- Author
-
Yaldiz, Burcu, Aydın Son, Yeşim, and Diğer
- Subjects
Genetics ,Genetik - Abstract
DNA'nın çift sarmal yapısının, genom boyunca homojen olduğu kabul edilmekteydi. Ancak, pek çok çalışmada, DNA'nın fiziksel yapısında, burkulmalar, eğilmeler, kaymalar ve açılmalar gibi lokal sarmal parametrelere ve komşu baz çiftleri arasındaki açılara dayalı değişiklikler olduğu gösterilmiştir. Bu durum, DNA'nın biyolojik fonksiyonlarını nasıl yerine getirdiğini açıklayacak daha iyi bir model sunarken, DNA'nın bilinen fiziksel ve kimyasal özelliklerini de sağlar. Pek çok çalışmada, bazı kanser türlerinde insan promotörlerinin metilasyon durumlarıyla gen ekspresyonu profilleri arasındaki ilişki gösterilmiş olmasına karşın metillenmiş promotörlerin yapısal özelliklerini inceleyen çalışmalara sık rastlanmamaktadır. Bu çalışmada bizim amacımız, insan promotörlerinin, metilasyon durumlarına ve gen ekspresyon profillerine göre sekansa bağlı DNA heliksel açıklığı açısından yapısal farklılıklarını incelemektir. Elde edilen yapısal farklılıkların, genom boyunca insan promotörlerinin metilasyon durumlarını öngören klinik açıdan önemli biyo-belirteçler elde edilmesini sağlayacak diğer çalışmalarda kullanılma potansiyeli vardır. The infamous double helix structure of DNA was assumed to be a rigid, uniformly observed structure throughout the genomic DNA. However, the differences in physical structure of DNA in terms of local helical parameters such as twist, tilt, roll, rise and angles between adjacent base pairs in B-DNA molecule have been shown in many studies. This observed flexibility satisfies the known physical and chemical properties of DNA while providing a better model to explain how DNA fulfills its biological functions. While the relation between human promoters' methylation status and gene expression profiles in certain cancer types has been established in various studies, the structural properties of methylated promoters were rarely investigated. In this study our goal is to investigate the structural differences between human promoters due to methylation status and gene expression profiles in terms of sequence dependent DNA helical rise. The resulting structural differences have the potential to facilitate further studies to predict the methylation status of human promoters across the whole genome for the investigation of clinically relevant biomarkers in cancer. 75
- Published
- 2014
25. A predictive model for type 2 diabetes mellitus based on genomic and phenotypic risk factors
- Author
-
Gül, Hüsamettin, Aydın Son, Yeşim, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Endocrinology and Metabolic Diseases ,Endokrinoloji ve Metabolizma Hastalıkları ,Genetics ,Genetik ,Medical Biology ,Tıbbi Biyoloji - Abstract
Tip 2 Diyabet yaygınlığı dünya çapında artmasına karşılık, T2D için erken risk tahminine yönelik bir metoda sahip değiliz. Fenotip değişkenleri ancak T2D'nin başlangıcında ya da gelişiminden sonra risk tahminine katkıda bulunmaktadır. Genetik modellerin ise şu ana kadar tahmin kabiliyeti küçük ya da ihmal edilebilir olarak bulunmuştur. T2D çoğunlukla genetik temele sahiptir, fakat günümüze kadar tanımlanan genetik bölgeler genetik mirasın ancak %10'unu açıklamaktadır. Biz bu çalışmada, `Hemşireler Sağlık Çalışması (NHS)` ve `Sağlık Çalışanları İzleme Çalışması (HPFS)` nin verileri ile ikili lojistik regresyon analizi metodunu kullanarak daha iyi ve erken risk tahmini yapabilecek bir metot geliştirmeye çalıştık. Fenotip değişkenleri, %70.7 tahmin değeri ve 0.77 eğri altında kalan alan değeri oluşturdu. Genotip ise, P değeri 1.0E-3'tek küçük 798 adet tek nükleotid polimorfizmi (SNP) kullanarak %90 tahmin doğruluğu ve 0.965 eğri altında kalan alan değeri oluşturdu. Bu değer, fenotip değişkenleri ile bile elde edilen değerden daha yüksek, literatürdeki en yüksek değerdir. Fenotip ve genotip değişkenlerinin birlikte oluşturdukları tahmin değeri ise %92.9 ve eğri altında kalan alan 0.98'dir. Bizim bulgularımız, genotip tabanlı metotların yüksek tahmin değeri elde etmek ve erken risk tahmini için kullanılabileceğini göstermektedir. Bu bulgular, genetik olarak geçen risklerin ortaya çıkarılması suretiyle genom çaplı ilişkilendirme çalışmalarına yeni imkanlar sağlamaktadır. Genotip verileri ile erken tanı sayesinde diyet ve yaşamsal değişiklikler yapılarak daha sağlıklı bir toplum meydana gelebilir. Bu çalışmanın sonuçları takip çalışmaları ile doğrulanmalıdır. Despite the rise in type 2 diabetes (T2D) prevalence worldwide, we do not have a method for early T2D risk prediction. Phenotype variables only contribute to risk prediction near the onset or after the development of T2D. The predictive ability of genetic models has been found to be little or negligible so far. T2D has mostly genetic background but the genetic loci identified so far account for only a small fraction (10%) of the overall heritable risk. In this study, we used data from The Nurses' Health Study and Health Professionals' Follow-up Study cohorts to develop a better and early risk prediction method for T2D by using binary logistic regression. Phenotypic variables yielded 70.7% overall correctness and an area under curve (AUC) of 0.77. With regard to genotype, 798 single nucleotide polymorphisms (SNPs) with P values lower than 1.0E-3, yielded 90.0% correctness and an AUC of 0.965. This is the highest score in literature, even including the scores obtained with phenotypic variables. The additive contributions of phenotype and genotype increased the overall correctness to 92.9%, and AUC to 0.980. Our results showed that the genotype could be used to obtain a higher score, which could enable early risk prediction. These findings present new possibilities for genome-wide association study (GWAS) analysis in terms of discovering missing heritability. Changes in diet and lifestyle due to early risk prediction using genotype could result in a healthier population. These results should be confirmed by follow-up studies. 144
- Published
- 2014
26. A hybrid feature selection model for genome wide association studies
- Author
-
Yücebaş, Sait Can, Baykal, Nazife, Aydın Son, Yeşim, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Moleküler Tıp ,Molecular Medicine ,Biyoteknoloji ,Computer Engineering and Computer Science and Control ,Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol ,Biotechnology - Abstract
Bütünsel genom ilişkilendirme çalışmaları karmaşık hastalıklar ve SNPler arasındaki ilişkileri keşfetmektedir. Bu çalışmalar yüksek miktarda çok boyutlu veri sunmaktadır. Ayrıca SNPler, hastalıklar ve fenotipler arasındaki ilişkiler genellikle doğrusal değildir. Yüksek miktarlı çok boyutlu verilerle çalışmak ve aralarındaki ve doğrusal olmayan ilişkileri bulabilmek için veri madenciliğine ihtiyaç duyulmaktadır. Genotip ve fenotip bilgilerini birleştirerek bunlar üzerinde çıkarsama yapan, karar ağacı ve destekçi vektör makinasından oluşan bir hibrid sistem tasarlanmıştır. Tasarlanan model NCBIın dbGaP veritabanından indirilmiş olan prostat ve melanoma veri kümeleri üzerinde denenmiştir. Prostat veri kümesinde sadece genotip bilgileri kullanıldığında %71,67lik kesinlik sonucu, sadece fenotip bilgileri kullanıldığında %84,3 kesinlik sonucu; genotip ve fenotip bilgileri birleştirildiğinde ise %93,81?e yükselen kesinlik sonucu elde edilmiştir. Melanoma veri kümesinde sadece genotipler kullanıldığında %57,12, sadece fenotip bilgileri kullanıldığında %75,18 ve fenotip ile genotip bilgileri birleştirildiğinde %86,35lik bir kesinlik sonucu elde edilmiştir. Prostat üzerinde çalıştırılan sistem, %90.92lik duyarlılık ve 0.91lik ROC eğrisi altında kalan alan ile Prostata Özel Antijen Testine üstünlük göstermiştir. Melanoma için ise hibrid modelin seçmiş olduğu fenotip ve genotip özellikleri bundan önceki çalışmalarda incelenmiş olup bu durum kurulan hibrid sistemin melanoma için en ayırt edici özellikleri seçme yetisi olduğunu göstermektedir. Bu sayede melanoma için kurulan hibrid sistemin risk gruplarını ayırt etme potansiyeli bulunmaktadır.Anahtar Kelimeler: Bütünsel Genom İlişkilendirme Çalışmaları, Karar Ağacı, Destek Vektör Makinası, Prostat Kanseri, Melanoma Through Genome Wide Association Studies (GWAS) many SNP-complex disease relations have been investigated so far. GWAS presents high amount high dimensional data and relations between SNPs, phenotypes and diseases are most likely to be nonlinear. In order to handle high volume-high dimensional data and to be able to find the nonlinear relations, data mining approaches are needed. A hybrid feature selection model of support vector machine and decision tree has been designed. This model also combines the genotype and phenotype information to increase the diagnostic performance. The model is tested on prostate cancer and melanoma data that have been downloaded from NCBIs dbGaP database. On prostate cancer data the hybrid system performed 71.67% accuracy on data set consists of only genotypes, 84.23% accuracy on data set consists of only phenotypes and when genotyping and phenotypes are integrated accuracy increased to 93.81%. On melanoma data, the hybrid system performed 57.12% accuracy for only genotypes, 75.48% accuracy for only phenotypes and when genotyping and phenotypes are integrated accuracy increased to 86.35%. For prostate cancer case the hybrid systems has performance indicators of 90.92% of sensitivity and 0.91 AUC, which outperforms Prostate Specific Antigen (PSA) test. In melanoma case selected phenotypic and genotypic features were also examined by previous studies that shows the ability of the system to select most predictive features so the hybrid system on melanoma case has a potential to be used for identifying the risk groups.Keywords: Genome Wide Association Studies, Decision Tree, Support Vector Machine, Prostate Cancer, Melanoma 180
- Published
- 2013
27. Investigation of schizophrenia related genes and pathways through genome wide association studies
- Author
-
Döm, Hüseyin Alper, Aydın Son, Yeşim, and Diğer
- Subjects
Psychiatry ,Nöroloji ,Analytical hierarchy process ,Neurology ,Schizophrenia ,Biology ,Biyoloji ,Psikiyatri - Abstract
Şizofreni genellikle zihinsel süreçleri ve duygusal tepkileri etkileyen kompleks bir zihinsel bozukluk olarak karakterize edilir ve herhangi bir toplumun %1ini etkiler. SNPler, DNA sekansında meydana gelen tek bazlık nükleotid değişimleri olup genomik varyasyonların büyük çoğunluğunu oluştururlar. Bu çalışmada amacımız şizofreni ile ilişkili olan SNP'lerin genomik belirteçler olarak tanımlanması ve SNP'lerin analizleri sonucu tanımlanmış gen ve yolakların araştırılmasıydı. Genom çapında ilişkilendirme çalışmaları (GWAS) genetik varyasyonları tanımlamak ve SNP gibi bu varyasyonlarla ilişkili belirteçleri araştırmak için hasta ve kontrol gruplarının bütün genomlarının analiz edilmesidir. GWASlar sıradan genetik bağlantı çalışmaları yetersiz kaldığından şizofreni gibi kompleks hastalıkların araştırılmasında en sık kullanılan yöntemlerdir. dbGAP şizofreni genotip veri setinin analizi 909.622 SNPden p-değeri 5x10-5'ten başlayan 25.555 SNP tanımladı. Sonrasında, kombine p-değeri yaklaşımıyla ilişkili gen ve yolakları tanımlamak ve de AHP'ye dayalı istatistiksel olarak yüksek anlamlı ve biyolojik olarak anlamlı SNPlerin önceliklendirilmesi çalışmaları için METU-SNP yazılımı kullanılmıştır. AHP puanı 0,4 ve üzerisi olan ve 2.500 gene atanan 6.000 SNPnin şizofreni ve şizofreniyle ilgili kondisyonlarla ilişkili olduğu önerilmiştir. Daha önce tanımlanan nörolojik yolaklara ilaveten, yolak ve ağ analizleri zenginleştirilmiş iki yeni yolak ortaya çıkardı.Melanogenesis ve damarsal düz kas kasılma (vascular smooth muscle contraction) yolaklarının şizofreni ile yüksek ilgisinin olduğu bulundu. Ayrıca bu yolakların şizofreninin moleküler etiyolojisinde rol oynayabilecek tek bir biyolojik ağ oluşturduğunu gösterdik. Tüm analizlerin sonuçları neticesinde de şizofreni ile muhtemel ilgisi bulunan SOS1 ve GUCY1B3 genleri iki yeni aday gen olarak ortaya çıkmıştır.Anahtar kelimeler: METU-SNP, AHP, GWAS, yolak ve gen keşfi, şizofreni Schizophrenia is a complex mental disorder that is commonly characterized as deterioration of intellectual process and emotional responses and affects 1% of any given population. SNPs are single nucleotide changes that take place in DNA sequences and establish the major percentage of genomic variations. In this study, our goal was to identify SNPs as genomic markers that are related with schizophrenia and investigate the genes and pathways that are identified through the analysis of SNPs. Genome wide association studies (GWAS) analyse the whole genome of case and control groups to identify genetic variations and search for related markers, like SNPs. GWASs are the most common method to investigate genetic causes of a complex disease such as schizophrenia because regular linkage studies are not sufficient. Out of 909,622 SNPs analysis of the dbGAP Schizophrenia genotyping data identified 25,555 SNPs with a p-value 5x10-5. Next, combined p-value approach to identify associated genes and pathways and AHP based prioritization to select biologically relevant SNPs with high statistical association are used through METU-SNP software. 6,000 SNPs had an AHP score above 0.4, which mapped to 2,500 genes suggested to be associated with schizophrenia and related conditions. In addition to previously described neurological pathways, pathway and network analysis showed enrichment of two pathways.Melanogenesis and vascular smooth muscle contraction pathways were found to be highly associated with schizophrenia. We have also shown that these pathways can be organized in one biological network, which might have a role in the molecular etiology of schizophrenia. Overall analysis results revealed two novel candidate genes SOS1 and GUCY1B3 that have a possible relation with schizophrenia.Keywords: METU-SNP, AHP, GWAS, pathway and gene discovery, schizophrenia. 142
- Published
- 2013
28. A framework for gene co-expression network analysis of lung cancer
- Author
-
Akdemir, Erhan, Can, Tolga, Aydın Son, Yeşim, and Diğer
- Subjects
Oncology ,Biology ,Biyoloji ,Onkoloji - Abstract
Hastalıkla ilgili genlerin ortaya çıkarılmasını amaçlayan medikal araştırmalarda gen ortak ifade ağlarının oluşturulma biçimi önemlidir. Uygulanan benzerlik ölçüsü ve ağdaki anlamlı ortak ifadeye sahip gen çiftlerini temsil eden bağlantıların seçimi ağın öğeleri ve öne çıkarılan genleri doğrudan etkiler. Pearson korelasyon katsayısı basitliği ve diğer bir çok karmaşık yönteme karşı üstünlüğü nedeniyle genlerin ortak ifadesinin sayısallaştırılmasında sıkça kullanılan bir benzerlik ölçüsüdür. Ancak aykırı değerlerden etkilenir ve örnek sayısının azlığında güvenilir olmayabilir. Diğer yandan, genelde keyfi belirlenmiş bir eşiğin üzerindeki ortak ifadeler ağa seçilir, bu da ağı öznel yapar. Daha standart ve doğru bir analiz için benzerlik ölçüsünün güvenilirliği ve bağlantıların objektif olarak belirlenen bir eşiğe göre seçilmesi sağlanmalıdır. Burada sağlıklı ve kanser durumları arasındaki genel eş ifade farklılıklarını bulmak için kullanılabilecek, daha önce Pearson korelasyon katsayısına uygulanmış bir kararlılık ölçüsü olan korelasyon kararlılığı ile otomatik bir ağ oluşturma yöntemi olan rastlantısal matris teorisinin birleştirildiği bir ağ oluşturma sistemi önerilmektedir. Önerilen sistem akciğer adenokanserine uygulanmıştır. Analiz aşamasında genler kontrol ve hastalık ağlarındaki topolojik ve komşuluk özelliklerinin değişimine bağlı olarak öne çıkartılmıştır. Bilinen protein-protein etkileşimleri ve düzensiz proteinlerin eş ifadeleri de analiz edilmiştir. Sonuçlar eş-ifade ağlarının tekerlek benzeri bir yapıda, kontrol örneklerinin ise sağlıklıdan kanser durumuna geçiş fazında olduğunu önermektedir. Bu yüzden kanser ve sağlıklı durumları arasındaki genel eş ifade farklılıkları değerlendirilememiştir. Hem önerilen hem de kontrol amacıyla kullanılan yöntemle öne çıkarılan genler çoğunlukla geçiş fazını yansıtan hücre etkinlikleriyle ilgilidir ve daha sonra yapılacak derin analizlerle faz geçişinin dinamik özelliklerini ortaya çıkartabilir. Dahası faz geçişinin erken dönemlerinde etkisi olabilecek siliya ile ilgili bazı genler öne çıkartılmıştır.Anahtar sözcükler: gen ortak ifade ağları, korelasyon kararlılığı, rastlantısal matris teorisi, akciğer adenokanseri Construction method of a gene co-expression network (GCN) is crucial in medical research aiming to reveal disease related genes. Applied similarity measure and selection of edges that represent significantly co-expressed gene pairs in the network affect directly the elements of a network and so the list of prioritized genes. Pearson correlation coefficient is a commonly used similarity measure to quantify co-expressions of genes due to its simplicity and performance compared to many complex methods. However, it is affected by outliers and may not be reliable with low sample size. On the other hand, selection of edges is generally based on an arbitrary cutoff which makes networks subjective. For a more standard and accurate analysis, reliability of a similarity measure must be ensured as well as an objective threshold determination for the selection of edges. Here, a framework is proposed for the construction of GCNs that combines a reliability measure, stability, previously applied to Pearson correlation coefficient to detect general co-expression differences between healthy and cancer state and an automatic threshold selection method, Random Matrix Theory for a standard network construction. The proposed framework was applied to lung adenocarcinoma. In the analysis part, genes were prioritized by using changes in topological and neighborhood properties of nodes in control and disease networks. Differential co-expressions of known interacting proteins and intrinsically disordered proteins were also analyzed. Results suggest that co-expression networks are topologically spoke-like and control samples are in transition phase from healthy to cancer. Thus, effects of stability on finding general co-expression differences between cancer and healthy states could not be assessed. Prioritized genes by both proposed and control methods are mostly enriched to relevant processes reflect the changes in cellular machinery as a result of a state shift to cancer and may reveal dynamical features of transition of cells to cancer state with a further detailed analysis. Furthermore, some genes were prioritized related with cilia which may have roles early phases of transition.Keywords: gene co-expression networks, stability of correlation, Random Matrix Theory, lung adenocarcinoma 60
- Published
- 2013
29. Investigation of human promoter CpG content and methylation profiles at different conservation levels
- Author
-
Demiralay, Burak, Aydın Son, Yeşim, and Diğer
- Subjects
Biyoistatistik ,Genetics ,Genetik ,Biostatistics ,Biology ,Biyoloji - Abstract
Promotor bölgelerinde bulunan CpG'lerin metilasyonu gen ekspresyonu ve gen susturulmasında kullanılan bir yöntemdir. Promotor bölgelerinin az ya da çok metilasyonu başta kanser olmak üzere birçok hastalıkla ilişkilendirilmiştir. Promotor CpG adalarındaki metilasyon, gen ekspresyonunu düzenleyen önemli bir profil olduğu halde, metilasyon aracığılıyla gen susturmanın tam mekanizması ve bireysel CpG'lerin rolü bilinmemektedir. Bu çalışma değişik evrimsel zaman dilimleri üzerinde promoter CpG sayısını ve metilasyon profilini hesaplayarak; evrim baskısının promotor CpG'leri üzerindeki etkisini araştırmaya yöneliktir. Araştırdığımız her kategorideki genlerin listesini bulabilmek için, ENSEMBL veritabanından 58 canlının genomu üzerinde çalıştık. Promotor bölgelerindeki CpG'lerin toplam sayısı hesaplanıp karşılaştırılmıştır. Ek olarak, fibroblast ve beyaz kan hücrelerindeki promoter CpG'lerin metilasyon profili de karşılaştırılmıştır. Ortak genlerden yeni genlere doğru ilerlerken promoterların CpG içeriğinin değiştiği gözlenmiş ama metilasyona uğramış CpG'ler istikrarlı bulunmuştur. Bu çalışmada, değişik zaman ve korunmuşluk durumlarındaki ortak genlerin fonksiyonel analizi yapılmış ve değişik evrimsel korunma statüsündeki genlerin promoter CpG içeriğini ve metilasyon profillerini karşılaştırılmıştır. Bu çalışmada ayrıca her bir metilli CpG'nin az ve çok metilli gen prometerlarındaki korunma durumunu da incelenmiştir. Analiz sonuçları yüksek oranda metilli CpG'lerin etrafındaki diğer metilli CpG sayısının, CpG'lerin türler arasındaki korunması üzerinde olumlu etkisi olduğunu gösterdi. Methylation of CpG islands located at the promoter regions is a mechanism which controls gene silencing and expression. Hyper or hypo methylation of these sites on promoter sequences have been associated with many diseases, like cancer. Even though promoter CpG islands and their methylation profiles are important regulators of gene expression, the exact mechanism of gene silencing through methylation is not known. Here, we have investigated the status of promoter CpG methylation under various evolutionary pressures by calculating the differences in promoter CpG content and methylation profiles at different pass points. In order to determine the list of genes under each category we have analyzed and compared the orthologs among 58 genomes available through ENSEMBL. The total number of CpG dinucleotides at the promoter regions of all groups of genes have been calculated and compared. Additionally, we have compared the experimentally determined methylation profiles of these CpG's between human blood cells and fibroblast cells. While the promoter CpG content changed through common to newer genes, the number of the CpG units methylated found to be consistent. Here, we present the functional level analysis of common gene lists at different pass points and report the differences of the promoter CpG content and the methylation profiles among these groups with distinct evolutionary conservation status. We have also observed the conservation status of individual methylated CpG units on the low and high methylated genes. Our analysis revealed that the surrounding methylation content had a positive effect on the conservation of individual CpG?s. 47
- Published
- 2012
30. Predicting the disease of alzheimer (AD) with SNP biomarkers and clinical data based decision support system using data mining classification approaches
- Author
-
Erdoğan, Onur, Aydın Son, Yeşim, and Sağlık Bilişimi Anabilim Dalı
- Subjects
Biyoistatistik ,Genetics ,Genetik ,Biostatistics - Abstract
Tek Nükleotit Polimorfizmi (SNP), insan genomundaki tek nükleotitin (A, T, C, G) bireyler arasında değişiklik gösterdiği en yaygın DNA dizisi çeşitliliğidir. SNPler, bireysel fenotipik farklılıkların arkasındaki temel genetik neden olmak dışında birçok kompleks hastalıklarında altında yatan sebep olabilir. Tek nükleotit değişimlerinin hastalıkla ilişkilendirilmesi ve klinik bulgularla birlikte bireylerin genotip verilerinin analizi, klinik açıdan hastalığın tahmin edilmesi için ekonomik ve pratik bir metodoloji sağlayacaktır. Bu yüzden, belirli bir hastalığın tespiti veya tahmin edilebilmesi için bilgi verici bir SNP kümesinin ve klinik verilerin belirlenmesi gerekir. Şimdiye kadar, klinik verilerle temsilci bir SNP kümesinin seçilmesi ve çok büyük veri tabanlarından gizli ve anahtar örüntülerin bulunması temeline dayanan veri madenciliği metodolojisi için yerleşik bir yaklaşım bulunmamaktadır. Bu yaklaşım genom veri setlerinde bilgi keşfi için ve ayrıca klinik teşhislerde hastalıkla alakalı bilgi verici SNP sayısını ve klinik özellikleri seçmek için en yüksek potansiyele sahiptir. Bu çalışmada, bunamanın en yaygın hali olan Alzheimer (AD) hastalığı ile SNP biyolojik göstergeleri ve klinik verileri ilişkilendirmek için, yaygınca kullanılan veri madenciliği sınıflandırma yöntemlerinden ?karar ağacı? metodolojisi uygulanmıştır. Farklı karar ağacı oluşturma parametreleri, ağacı en optimal duruma getirmek üzere karşılaştırılmıştır ve Alzheimer (AD) hastalığını doğru tahmin eden karar ağacı sunulmuştur. Single Nucleotide Polymorphisms (SNPs) are the most common DNA sequence variations where only a single nucleotide (A, T, C, G) in the human genome differs between individuals. Besides being the main genetic reason behind individual phenotypic differences, SNP variations have the potential to exploit the molecular basis of many complex diseases. Association of SNPs subset with diseases and analysis of the genotyping data with clinical findings will provide practical and affordable methodologies for the prediction of diseases in clinical settings. So, there is a need to determine the SNP subsets and patients? clinical data which is informative for the prediction or the diagnosis of the particular diseases. So far, there is no established approach for selecting the representative SNP subset and patients? clinical data, and data mining methodology that is based on finding hidden and key patterns over huge databases. This approach have the highest potential for extracting the knowledge from genomic datasets and to select the number of SNPs and most effective clinical features for diseases that are informative and relevant for clinical diagnosis. In this study we have applied one of the widely used data mining classification methodology: ?decision tree? for associating the SNP Biomarkers and clinical data with the Alzheimer?s disease (AD), which is the most common form of ?dementia?. Different tree construction parameters have been compared for the optimization, and the most efficient and accurate tree for predicting the AD is presented. 152
- Published
- 2012
31. Analitik hiyerarşi sürecine dayalı tek nukleotid polimorfizmi önceliklendirme yaklaşımı performans parametrelerinin alzheımer hastalığı verisi için belirlenmesi
- Author
-
Kadioğlu, Onat, Aydın Son, Yeşim, and Diğer
- Subjects
Analytical hierarchy process ,Biyoistatistik ,Genetics ,Genetik ,Biostatistics ,Polymorphism-genetic - Abstract
Genom boyutunda ilişkilendirme çalışmaları (GWAS) genel olarak biyolojik çeşitliliğin araştırılması ve çeşitli hastalıklarla ilişkilendirilmesiyle ilgilidir. GWAS den sonraki aşama olarak tanımlanan birleşik p değeri anlamlı olarak bulunan SNPlerin genlerdeki yerlerini belirlemek ve daha sonra SNP-gen-hastalık ilişkisini saptamak için kullanılabilir. İstatistiksel olarak anlamlı sonuçları önceliklendirmek mevcut GWAS analizlerinin başlıca eksikliklerdendir. Hastalıkların moleküler mekanizmalarını daha iyi anlayabilmemiz için istatistiksel analiz ve SNP lerin biyolojik anlamlılıkları arasındaki bağlantı daha sağlam bir şekilde kurulmalıdır. SNP önceliklendirmesi için geliştirilmiş az sayıdaki yazılımlar standardizasyonu güç olan kullanıcı tanımlı öznel paramatrelere dayalı uygulamalardan öteye geçememektedirler. AHP (Analitik Hiyerarşi Süreci) tabanlı yapılandırılmış SNP önceliklendirmesi için grubumuz tarafından geliştirilen algoritma; SNPlerin biyolojik anlamlılıklarının genomik lokasyona, fonksiyonel sonuçlara, evrimsel korunmaya ve gen-hastalık ilişkilendirilmesine göre skorlandırılmalarına dayanmaktadır. Böylece istatistiksel olarak anlamlı SNP ler araştırmacılar tarafından kolayca nesnel olarak değerlendirilmiş olur ve yüksek skora sahip olanlar, onaylama ve daha sonraki muhtemel uygulamalar için kullanılabilir. Bu çalışmada AHP tabanlı önceliklendirme yaklaşımının performansını, algoritmanın uygulanmasında sonraki adım olarak diğer SNP önceliklendirme metotlarıyla karşılaştırarak değerlendirdik. AHP tabanlı önceliklendirme için kullanıcı tanımlı parametreler araştırıldı ve bu parametrelerin nasıl kullanılması gerektiği sunuldu. Ek olarak, iki adet Alzheimer Hastalığı (AD) Genotipleme datasının yeni oluşturulan AHP tabanlı önceliklendirme yaklaşımıyla ve bu yaklaşımın uygulandığı METU-SNP uygulaması ile yapılan analizlerinden elde edilen GWAS sonuçları sunuldu. Bu analizler ışığında SNPlerin ve genlerin AD ilişkisi ile ilgili yeni bulgular da ele alındı. GWAS mainly aim to identify variations associated with certain phenotypes or diseases. Recently the combined p-value approach is described as the next step after GWAS to map the significant SNPs to genes and pathways to evaluate SNP-gene-disease associations. Major bottleneck of standard GWAS approaches is the prioritization of statistically significant results. The connection between statistical analysis and biological relevance should be established to understand the underlying molecular mechanisms of diseases. There are few tools offered for SNP prioritization but these are mainly based on user-defined subjective parameters, which are hard to standardize. Our group has recently developed a novel AHP based SNP prioritization algorithm. Beside statistical association AHP based SNP prioritization algorithm scores SNPs according to their biological relevance in terms of genomic location, functional consequence, evolutionary conservation, and gene-disease association. This allows researchers to evaluate the significantly associated SNPs quickly and objectively. Here, we have investigated the performance of the AHP based prioritization as the next step in the utilization of the algorithm in comparison to the other available tools for SNP prioritization. The user-defined parameters for AHP based prioritization have been investigated and our suggestion on how to use these parameters are presented. Additionally, the GWAS results from the analysis of two different sets of Alzheimer Disease Genotyping data with the newly proposed AHP based prioritization and the integrated software, METU-SNP, it was implemented, is reported and our new findings on the association of SNPs and genes with AD based on this analysis is discussed. 108
- Published
- 2011
32. An integrative approach to structured SNP prioritization and representative snp selection for genome-wide association studies
- Author
-
Üstünkar, Gürkan, Aydın Son, Yeşim, Weber, Gerhard Wilhelm, and Diğer
- Subjects
Biyoistatistik ,Genetics ,Genetik ,Biostatistics ,Computer Engineering and Computer Science and Control ,Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol - Abstract
Tek Nükleotit Polymorfizmi (SNP) en yaygın olarak görülen genom çeşitliliği ve kişiler arasındaki genetik farklılıkların ve birçok hastalığın temel nedenidir. Günümüzde milyonlarca SNP genotipinin bir seferde belirlenmesi mikro dizilim ve ileri sekanslama teknolojileri sayesinde mümkündür. Yüksek verimli teknolojilerin kullanıma girmesi ile SNPler gözde biyolojik göstergeler arasına girmiştir. SNPlerin genom boyutunda ilişkilendirme çalışmalarında istatistiksel analiz safhasından sonra gerek SNPlerin önceliklendirilmesinde gerekse temsilci bir SNP kümesinin seçilmesinde mevcut standart bir yöntem olmadığı için bir darboğazla karşılaşılmaktadır. Bu çalışmada, SNPleri biyolojik ve istatistiksel önemlerine göre önceliklendirilmesinde kullanılabilecek java tabanlı bütünleşik bir sistem oluşturulmuştur. SNPlerin objektif olarak önceliklendirilebilmesi için Analitik Hiyerarşi Prosesinden yararlanılmıştır. Ek olarak birleşik p-değeri yöntemine dayanan ve hastalıkla ilgili SNPlerle ilişkili gen ve biyolojik yolakların ikincil analizinde yeni kullanılmaya başlanan bir yöntem de önceliklendirme esnasında kullanılmıştır. Hastalıkla ilişkili bütün SNPler için temsilci bir SNP alt kümesinin seçilmesi daha az kapasiteli bilgisayarlarla ve daha ucuza analiz ve ardıl ilişkilendirme ve biyolojik gösterge bulma işlemlerinin yapılabilmesini sağlar. Bu amaçla temsilci SNP seçimi için Benzetilmiş Tavlama algoritmasına dayalı yenilikçi bir algoritma geliştirilmiştir. Geliştirilen yöntemlerin geçerliliği ve doğruluğu gerçek bir vaka-kontrol çalışmasından alınan verilerle kontrol edilmiş, biyolojik olarak anlamlı sonuçlara ulaşılmıştır. Bu çalışmada geliştirilen bütünleşik masaüstü uygulamasının karmaşık hastalıklarla ilişkili SNPlerin güvenilir bir biçimde belirlenmesinde büyük rolü olacaktır ve ileride hastalıkla ilişkili biyolojik göstergelerin ortaya çıkarılmasını ve kişiselleştirilmiş ve hedefe yönelik ilaçların keşfedilmesini destekleyeceğini öngörmekteyiz. Single Nucleotide Polymorphisms (SNPs) are the most frequent genomic variations and the main basis for genetic differences among individuals and many diseases. As genotyping millions of SNPs at once is now possible with the microarrays and advanced sequencing technologies, SNPs are becoming more popular as genomic biomarkers. Like other high-throughput research techniques, genome wide association studies (GWAS) of SNPs usually hit a bottleneck after statistical analysis of significantly associated SNPs, as there is no standardized approach to prioritize SNPs or to select representative SNPs that show association with the conditions under study. In this study, a java based integrated system that makes use of major public databases to prioritize SNPs according to their biological relevance and statistical significance has been constructed. The Analytic Hierarchy Process, has been utilized for objective prioritization of SNPs and a new emerging methodology for second-wave analysis of genes and pathways related to disease associated SNPs based on a combined p-value approach is applied into the prioritization scheme. Using the subset of SNPs that is most representative of all SNPs associated with the diseases reduces the required computational power for analysis and decreases cost of following association and biomarker discovery studies. In addition to the proposed prioritization system, we have developed a novel feature selection method based on Simulated Annealing (SA) for representative SNP selection. The validity and accuracy of developed model has been tested on real life case control data set and produced biologically meaningful results. The integrated desktop application developed in our study will facilitate reliable identification of SNPs that are involved in the etiology of complex diseases, ultimately supporting timely identification of genomic disease biomarkers, and development of personalized medicine approaches and targeted drug discoveries. 167
- Published
- 2011
33. METU-SNP: an integrated software system for SNP-complex disease association analysis.
- Author
-
Ustünkar G and Aydın Son Y
- Subjects
- Genome-Wide Association Study instrumentation, Humans, Linkage Disequilibrium, Genetic Predisposition to Disease, Genome-Wide Association Study methods, Polymorphism, Single Nucleotide, Software
- Abstract
Recently, there has been increasing research to discover genomic biomarkers, haplotypes, and potentially other variables that together contribute to the development of diseases. Single Nucleotide Polymorphisms (SNPs) are the most common form of genomic variations and they can represent an individual’s genetic variability in greatest detail. Genome-wide association studies (GWAS) of SNPs, high-dimensional case-control studies, are among the most promising approaches for identifying disease causing variants. METU-SNP software is a Java based integrated desktop application specifically designed for the prioritization of SNP biomarkers and the discovery of genes and pathways related to diseases via analysis of the GWAS case-control data. Outputs of METU-SNP can easily be utilized for the downstream biomarkers research to allow the prediction and the diagnosis of diseases and other personalized medical approaches. Here, we introduce and describe the system functionality and architecture of the METU-SNP. We believe that the METU-SNP will help researchers with the reliable identification of SNPs that are involved in the etiology of complex diseases, ultimately supporting the development of personalized medicine approaches and targeted drug discoveries.
- Published
- 2011
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.