%0 Journal Article %T Random Forests Y ntemi ve Sa l k Alan nda Bir Uygulama %A Muhammet AKMAN %A Yasemin GEN£ż %A Handan ANKARALI %J Turkiye Klinikleri Journal of Biostatistics %D 2011 %I Turkiye Klinikleri %X Ama : Veri madencili i, genel olarak tan mlay c ve tahmin edici olmak ¨ızere iki ana ba l kta incelenmektedir. zellikle t p alan nda veri madencili i daha ok tahmin edici y n¨ıyle kullan lmaktad r. Bu al mada, a a tabanl veri madencili i y ntemlerinden birisi olan Random Forests (RF) y nteminin incelenmesi ve sa l k alan ndan elde edilen bir veri seti ¨ızerine uygulamas yap larak sonu lar n n tart lmas ama lanm t r. Gere ve Y ntemler: RF y nteminde, karar orman n olu turan karar a a lar orijinal veri setinden bootstrap y ntemiyle se ilen farkl rneklerden olu turulmaktad r. Her karar a ac nda veri setindeki t¨ım de i kenlerden rastgele se ilen az say da de i ken kullan lmaktad r. Her a a bir s n f i in oy vermektedir ve orman s n flay c s b¨ıt¨ın a a lar n verdi i oylar toplayarak bir s n f i in son tahminini yapmaktad r. Y ntemin uygulanmas amac yla Di hekimli i alan ndan elde edilen bir veri seti kullan lm t r. Bulgular: Toplam 43 tane demografik, dental ve serolojik zelliklere ait veriler kullan larak RF y ntemi ile %95.4 oran nda ba ar l bir s n fland rma yap lm t r. Bu karar orman n n hata oran ise %3.33 olarak bulunmu tur. Ayn veri seti i in Bagging ve CART y ntemi ile de s n flama yap lm ve Bagging y ntemi ile hata oran %5.4, CART y ntemi ile %8.75 olarak bulunmu tur. Sonu : RF y ntemi ile veri setindeki de i ken say s ve rnek say s ne kadar ok olursa olsun genellikle hata oran d¨ı ¨ık s n flamalar yap lmaktad r. Hata oran n n d¨ı ¨ıkl¨ı ¨ı ise bir topluluk y ntemi olmas ndan kaynaklanmaktad r. zelikle ok say da de i kenin oldu u DNA veri seti gibi binlerce gen aras ndan nemli olanlar tespit etmek i in kullan labilir. %K Veri madencili i %K s n fland rma %K random forests %K karar a a lar %K karar orman %U http://www.turkiyeklinikleri.com/pdf/?pdf=6815820c3bfe9f962a904c92b28c5c81