recurrent neural network

zamanında bilim insanları basit neural networkler (multilayer perceptron) ve deep learning teknolojilerinin tek başlarına her işi yapabileceklerine inandılar. çünkü gerçekten bu teknolojiler her türlü işi yüksek hassasiyetle halledebiliyorlardı.

fakat sonra bir sorunla karşılaştılar, o da verilerin bir ihtimalle sıralı gelebilir olmasıydı.

rnn'lerden önceki klasik mimariler, saf matris çarpımları üzerinden çalışıyorlardı. ki bu belli bir zamana kadar hiç problem çıkarmadı. düşünün ki eldeki veri şöyle:

pencere sayısı: 5
genişlik: 160 metrekare
kat: 3

bu cins veriyi sırasını değiştirerek verseniz de bir şey farketmez. birbirlerinden bağımsızlar. sonrasında o deep neural networklere şu veriyi işlemeleri için verdiler ve tarihteki sayılı epic faillardan biri yaşandı:

örnek: ali, ahmet'i öldürdü.

bu eski teknolojiler ögelerin yerlerini kavrayamadiklari için ali mi ahmet'i yoksa ahmet mi ali'yi öldürdü anlayamadılar!

***

sonrasında ise lstm veya diğer adıyla recurrent neural networkler çıktı. bu yeni sistemde artık verilerin sırası da işin içine dahil edildi. bugün bu sistemleri kullanarak

* müziğin doğasını anlayıp yeni müzikler sentezleyebiliyoruz
* cümleleri okuyup olayı kavrayabiliyor, sonrasında farklı kelimelerle aynı olayı ifade ettirebiliyoruz. mesela "ali, ahmet'i öldürdü" cümlesini shakespeare tarzında tekrar yazdirabiliriz.
* makinelere yazı verip onları sesli olarak soyletebiliyoruz
* peş peşe resimler gösterip olayları yorumlamasını isteyebiliyoruz.

vb. sıranın önemli olduğu her işi yaptirabiliyoruz.