Bu Blog Ne Hakkında?

Bu blogu, birbirini tamamlayan iki sebeple açtım. Birincisi, kendi öğrenme sürecimi olabildiğince açık tutmak; ikincisi, dağınık biçimde edindiğim bilgileri yazarak sağlam bir zemine oturtmak. Yapay zeka, hızıyla insanı sürekli "yetişememe" hissinde bırakan bir alan; bu yazıların hem benim için bir düşünme alanı, hem de aynı yolda yürüyen başkaları için yararlı bir uğrak olmasını umuyorum.

Burada ne bulacaksınız

Yazıları üç ana eksende toplamayı düşünüyorum. İlki, deney günlükleri: bir yaklaşımın neden işe yaradığını ya da yaramadığını, sonucun yanında o sonuca götüren gerekçeyle birlikte anlatan notlar. İkincisi, derinlemesine teknik yazılar: bir kavramı sıfırdan, sezgiden formalizme doğru adım adım kuran uzun metinler. Üçüncüsü ise kısa notlar: okuduğum makalelerden çıkardığım dersler ve yolda denk geldiğim, başkalarının da vaktini kurtarabilecek tuzaklar.

Neden yazıyorum

Bir konuyu okuyup "anladım" demek kolaydır; ama o anlayışın ne kadar sağlam olduğunu çoğu zaman ancak yazmaya oturduğumuzda fark ederiz.

Bir şeyi gerçekten anlayıp anlamadığınızı, onu başkasına anlatmaya çalışınca öğrenirsiniz.

Yazmak, düşünceyi disipline eden bir süzgeçtir. Karmaşık bir ablation tablosunu ya da bir denklemin ardındaki sezgiyi birine sade bir dille aktarabiliyorsanız, o konuyu gerçekten içselleştirmişsiniz demektir; aktaramıyorsanız, çoğu zaman eksiğin tam olarak nerede olduğunu da yazma sırasında keşfedersiniz.

Teknik içeriğin gerektirdiği her şey burada destekleniyor: matematiksel gösterim, söz gelimi basit bir contrastive loss,

\mathcal{L} = -\log \frac{\exp(s_{ii}/\tau)}{\sum_j \exp(s_{ij}/\tau)}

kod blokları, tablolar ve görseller. Hoş geldiniz; umarım bu yazılar, sizin de kafanızdaki bir şeyleri yerli yerine oturtur.

Bu Blog Ne Hakkında?

Burada ne bulacaksınız

Neden yazıyorum

Benzer makaleler

Tensor Nedir? Derin Öğrenme için Lineer Cebir

Attention'ı Sıfırdan Anlamak

Gradient Descent Gerçekte Nasıl Çalışır