Inside AI Models
Makaleler
AI modellerinin nasıl çalıştığına dair eğitimler, deney günlükleri ve derinlemesine yazılar.
Bu Blog Ne Hakkında?
Bu günlüğü neden açtığıma, burada ne tür yazılar bulacağınıza ve yazmanın öğrenmenin neden ayrılmaz bir parçası olduğuna dair kısa bir giriş.
Tensor Nedir? Derin Öğrenme için Lineer Cebir
Skalerden tensöre uzanan merdiveni, shape kavramını ve bir sinir ağının neden baştan sona lineer cebirden ibaret olduğunu sıfırdan, sezgiyle kuruyoruz.
Attention'ı Sıfırdan Anlamak
Modern dil modellerinin kalbindeki mekanizmayı; query, key ve value vektörlerinden softmax'a, oradan da neden her şeyi değiştirdiğine uzanan bir hatla, tek bir sezgisel soru etrafında kuruyoruz.
Gradient Descent Gerçekte Nasıl Çalışır
Eğitilmiş her modelin arkasındaki optimizasyon döngüsünü; tepeli bir arazi benzetmesinden başlayıp türev, learning rate ve backpropagation'a uzanan bir hatla, kalkülüs ön koşulu olmadan kuruyoruz.
Kimlik-Farkında Negatif Örnekleme Neden Önemli
Multimodal deepfake tespitinde bir contrastive loss'un başarısı, büyük ölçüde negatif örneklerin niteliğine bağlıdır. Rastgele batch örneklemenin kritik negatifleri neden ıskaladığını ve identity-grouped sampling'in bunu nasıl onardığını inceliyoruz.