Veriden Makine Öğrenmesine Giden Yol | by Vedat KOÇYİĞİT

Verilerin çeşitli kaynaklardan alınması ve toplu veri elde etme sürecidir.Bu veriler CSV,XML,JSON,Net Scrapping,API,SQL gibi yerler veya araçlarla elde edilebilir.

Bu süreç verinin incelenmesini kapsar.Verini boyutu incelenir eksik değer tespiti oranı gibi değerler çıkarılır.

Temel metrikler hesaplanır(Ortalama,Medyan,Standart Sapma) veriler görselleştirlir veri hakkında analiz yapılır.

Bu aşamada eksik veriler işlenir.Aykırı değerler tespit edilip işlenir.

Yinelenen kayıtlar temizlenir.Veri tipleri düzenlenir ve standartizasyon yapılır.

Kategorik veriler sayısallaştırılır.Sayısal verilerin standartizasyonu ve normalizasyonu yapılır.Tarih-Zaman verileri işlenir.Metin verileri vektörleştirilir.

Var olan özellikleri kullanarak yeni özellikler türetmektir.Özellikler arasındaki etkileşimlerden yararlanılır.

İlk 5 adımda yapılan işlemler sonucu eldeki veriyi eğitim ve take a look at olarak ayırmamız gerekiyor eğitim kısmını ML modeline vererek mannequin eğitimini gerçekleştirip sonra da eldeki take a look at verisiyle mannequin üzerinde değerlendirmeler yapılır.

Veride bir sınıftan çok fazla varsa diğer modelleri görmezden gelebilir veya çok olan sınıfı ağırlık olarak alabilir bunun için dengeleme yapılması gerekir.Bunun için Undersampling(Alt Örnekleme) ve Oversampling(Aşırı Örnekleme) yapılır ama bunlar yapılırken alt örneklemede fazla olan sınıftaki veriler azaltılır bu da bilgi kaybına neden olabilir aynı şekil aşırı örneklemede az olan sınıf kopyalanır bu da Overfitting(Aşırı Öğrenme) neden olabilir.Başka bir çözümde SMOTE(Sentetik Veri Üretme) yapılabilir.

ML modellerinden veriye en uygun olanına bakılır önce verinin Regresyon,Sınıflandırma,Kümeleme …. olduğuna bakılır.Daha sonra seçilen türe göre ML modelleri denenip take a look at edilir en iyi sonuç veren mannequin seçilir.Hehangi bir downside için en iyi mannequin yoktur.En iyi ML modelini seçmek için verinin modeller üzerinde eğitilip take a look at edilmesi gerekir ve en sonunda modeller karşılaştırılarak en iyi modele karar verilir.

Source link

8 FREE Platforms to Host Machine Learning Models

09389212898

AI Just Dated Ancient Scrolls Without Destroying Them. That’s Kind of a Miracle! | by Mallory Twiss | Jun, 2025

What Is Open on Easter? Walmart, Whole Foods, Wegmans, More

AI Agents for a More Sustainable World

Building a Personal API for Your Data Projects with FastAPI

A new computational model can predict antibody structures more accurately | MIT News

New to LLMs? Start Here | Towards Data Science

Most Popular

Challenge Island Franchises Inspire Young Minds To Grow

How to Get Promoted as a Data Scientist

How User-Generated Content Helps You Build Trust and Credibility

Our Picks

When each human is a line of the dataset | by 侧成峰 | Mar, 2025

How Businesses Can Fight Financial Instability

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search | by Jyoti Dabass, Ph.D. | Feb, 2025

Veriden Makine Öğrenmesine Giden Yol | by Vedat KOÇYİĞİT | Apr, 2025

Related Posts