Habibe Güldamla Özsema

Habibe Güldamla Özsema

Data Stream Processing

Günümüzde çevrimiçi veri katarı (online data stream) formatında bulunan dijital bilgi; sağlık hizmetleri, bilim, ulaşım, finans, telekomünikasyon, üretim hattı teşhisleri vb. birçok alanda kullanılmaktadır. Bu veriler, yazılım ve donanım sensörleri tarafından canlı olarak üretilmektedir. Bu doğrultuda, dijital bilgiyi –neredeyse- gerçek zamanlı olarak toplamak, analiz etmek, paternlerini ve sonuçlarını bulmak elzem bir ihtiyaç oluşturmaktadır. Veri katarı işleme uygulamaları (streaming applications) sürekli veri katarlarını işleyerek bu ihtiyacı karşılamaktadır. Performans gereksinimleri ve optimizasyon ihtiyaçları sebebiyle her alanda ihtiyaç duyulan bu uygulamalarla ilgili ortak terimler oluşturulmuştur. Bu sunumda, ilk olarak gerçek-zamanlı veri işleme (real-time processing) ve veri katarı işleme arasındaki fark anlatılacaktır. Daha sonra veri katarı uygulamalarının temelini oluşturan veri katarı grafiği (a graph of streams), operatör (operator), seçicilik (selectivity), durum (state), iş parçası değiştirme maliyeti (thread switching cost), kopyalama maliyet faktörü (replication cost factor), paralleştirme türleri, maliyet (throughput) terimleri anlatılacaktır. Sunum küçük bir veri katarı grafiğinin maliyet hesabı yapılarak öğrenilen tüm terimlerin uygulaması ile sonlanacaktır.