Kayıt Ol

Giriş

Şifremi Kaybettim

Lost your password? Please enter your email address. You will receive a link and will create a new password via email.

Veri Madenciliği Nedir ?

Veri Madenciliği Nerelerde Kullanılır ?

Veri madenciliği veri içindeki saklı örüntülerin keşfedilerek ortaya çıkarılması amacıyla gerçekleştirilen çalışmaları kapsar.

Uzaysal zamanla ilintili veri kaynakları ve veri ambarları sistemleri gibi verilerin yoğun ve veriler arasındaki bağlantıların karmaşık bir yapı aldığı sistemlerde , daha etkin araştırmaların yapılabilmesi için veri madenciliğinden yararlanılır.

Günümüz teknolojik gelişmelerin katkısıyla çok büyük miktarlarda veriyi toplamak ve saklamak mümkündür. Bu neden ile , bu verilerin analizi , veriler arasındaki desenlerin ve farklılıkların , normal olmayan durumların keşfedilmesi önemli gereksinim haline gelmiştir.

Veritabanların da ki bilginin keşfedilmesi yani, var olan büyük miktarlardaki veriler incelenerek, daha önceden bilinmeyen ve yararlı bilgilerin çekilip ayrıştırılmasıyla amacıyla kullanılan önemli bir araçtır.

ver-madeni-nedir 

Veri madenciliği yöntemleri verilerin farklı boyutları kullanarak analiz edilmesi , kategorize edilmesi , özetlenmesi ve bağıntıların belirlenmesi amacıyla kullanılan yöntemlerdir.

Veri madenciliği yöntemleri ile, örneğin bir kişinin telefon numarasına ulaşılması gibi bir işlem gerçekleştirilemez, ancak şöyle bir analiz sonucuna erişilebilir.

‘Karedeniz Bölgesi’nde Dursun ismi çok yaygın olarak kullanılmaktadır.’

Bu amaçla istatistiksel yöntemler , akıllı sistem algoritmaları ,örüntü tanıma , özdevinimli öğrenme  gibi birçok farklı yaklaşım  izlenmektedir. Bu yöntemler, tahminsel ya da açıklayıcı olmak üzere iki grupta toplanmaktadır. Tahminsel yöntemler, bilinen bazı değişkenleri kullanarak bilinmeyen bir değişkenin değerini tahmin etmek için ya da geleceğe yönelik öngörülerde bulunmak için kullanılan yöntemlerdir. Açıklayıcı yöntemler ise ,verinin anlaşılırlığını arttırmak ve bilgi keşfini kolaylaştırmak amacıyla eldeki veriler arasında ki örüntüleri keşfetmeye yönelik olarak geliştirilen yöntemlerdir.



VERİ MADENCİLİĞİ AŞAMALARI

1.Veri seçimi          : analiz için verilerin seçilmesi

2.Ön-işlem             : seçilen verilerin analize yönelik olarak temizlenmesi

3.Dönüşüm            : verilerin analiz yapılacak biçime dönüştürülmesi

4.Veri madenciliği : hazırlanan veriler üzerinde amaca yönelik veri madenciliği metotlarının uygulanması

5.Amaca yönelik olarak bilgi elde edebilmek için ,sonuçların değerlendirilmesi.

VERİ MADENCİLİĞİ ANALİZLERİ

•Veri madenciliği analiz yöntemleri, istatiksel analizler, akıllı zeka yöntemleri ,sinir ağları gibi birçok farklı yaklaşım kullanılmaktadır.

•Genel olarak 4 tip yapı vardır. Bunlar sınıflar, kümeler, bağlantılar ve sıralı örüntülerdir.

SINIFLAR

  • Sınıf(class) yapısı verilerin daha önceden tanımlanmış olan grup yapılarında saklanmasını sağlar. Örneğin hastane yönetimi hastaların randevularını takip etmek isteyebilir ve hastaların hangi sıklıkla muayene olduklarını ve tipik hastaların neler olduğunu veri madenciliği yöntemleri ile bulmak isteyebilir.
  • Sınıflandırma yöntemi tahminsel çıkarımlarda bulunmayı hedefleyen yöntemlerden birisidir.
  • Bu örnekte aşağıdaki sınıflandırma algoritması kullanılarak ödüllendirme değeri bulunmuştur. Ünvan Prof. Dr. ise yada bu görevde çalışma süresi 7 yıl ve daha fazla ise bu kişiler ödüllendirilir diğer kişiler ödüllendirilmez.

KÜMELER

•Küme yapılarında, veri elemanları mantıksal ilişkilere ve müşteri tercihlerine göre gruplandırılabilir. Örneğin, veriler hastanenin bölümlerine ya da hastaların mesleklerine göre gruplanabilir. Kümelendirme yöntemi veriler üzerinde açıklayıcı analizler yapabilmeyi hedefleyen bir yöntemdir.

•Bağlanım bir değişkene ait süreklilik içeren bir verinin değerini, diğer değişkenlerin değerini temel olarak ve aralarında doğrusal ya da doğrusal olmayan bir bağımlılık olduğunu göz önüne alarak, piyasaya yeni sürülmüş bir ürünün satış tahminlerini yapmak amacıyla bu yöntem kullanılabilir.

SAPMA ALGILAMASI

•Sapma algılaması veriler üzerindeki normal davranışları inceleyerek, bu davranıştan anlamlı bir sapmanın olup olmadığını algılamaya çalışır. Sapma algoritması tahminsel çıkarımda bulunmayı hedefler.

VERİ MADENCİLİĞİ ANALİZ YÖNTEMLERİ

•Akıllı Zihinsel Ağlar

•Genetik Algoritmalar

•Karar Ağaçları

•En Yakın Komşu Metodu

•Kural Oluşturma

•Veri Görüntüleme

AKILLI ZİHİNSEL AĞLAR

Bu yaklaşım ile bir eğitim sonucunda öğrenebilen ve doğrusal olmayan tahmin modelleri oluşturulur. Bu modeller yapısal olarak, zihinsel ağ modellerini kullanırlar. Genetik Algoritmalar yaklaşımı, genetik kombinasyonlar, mutasyon ve doğal ayıklama gibi yaklaşımları kullanarak doğal bir değerlendirme sistemi gerçekleştirir. Karar Ağaçları, tanım kümelerini temsil etmek amacıyla kullanılan ağaç şeklindeki yapılardır. Bu tür kararlar, veri kümelerinin sınıflandırılması amacıyla kurallar geliştirirler. Veri kümesindeki her bir kaydı sınıflandırmaya yarayan metottur. Bu metoda göre sınıflandırma, zaman içinde değişim gösteren veri kümelerine en benzer veri kümelerinin seçilmesi ile gerçekleşir. 

Bu metoda göre gerçekleştirilen veri madenciliği yöntemleri, istatiksel olarak anlamlı if – then – else kurallarının oluşturulması ile verilen birbirleri arasındaki ilişki keşfedilir ve analiz edilir. Veri Görüntüleme metoduna göre ,karmaşık ilişkilerin çok boyutlu veri analizinde grafik araçları kullanılarak veriler arasındaki ilişkilerin görsel olarak görüntülendirilmesidir.

 

Yazar Hakkında

Leave a reply

Captcha Captcha güncellemek için resime tıkla

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">