Davranış Fonksiyonu Tabanlı Derin Pekişt˙irmeli Öğrenme Algor˙ıtmaları Eğitimminde Dağınık Mimari Kullanımı

Pekiştirmeli öğrenmede eğitimler genellikle zaman açısından maliyetli olup, bu durum karmaşık ortamlarda sorun teşkil edebilir. Bu nedenle dağıtık mimari kullanımı, karmaşık ortamlarda hızlı eğitim için etkili bir alternatif sunar. Veri veya model paralelleştirme yapılarak, pekiştirmeli öğrenme eğitimlerinde dağıtık mimarinin avantajlarından faydalanmak mümkündür. Bu tez çalışmasında, pekiştirmeli öğrenme (reinforcement learning) yöntemlerinde ajanların karmaşık görevlerde uzun eğitim süreleri ile karşılaşma sorunu ele alınmıştır. Önerilen yaklaşım, davranış fonksiyonu tabanlı pekiştirmeli öğrenme metotlarında ortam ile etkileşim kurularak biriktirilmesi gereken tecrübeleri, dağıtık işleme yöntemleri ile çoğaltılmış ortam kopyalarından eş zamanlı ve daha hızlı sağlamaktır. Dağıtık işleme yöntemi için python tabanlı DASK dağıtık hesaplama kütüphanesi kullanılmıştır. Geliştirilen yöntem, mevcut iki farklı yöntemle karşılaştırılmıştır. Alınan sonuçlar, önerilen yöntemin pekiştirmeli öğrenme modellerinin eğitimini hızlandırdığını göstermektedir.

Erişime Açık
Görüntülenme
6
22.03.2024 tarihinden bu yana
İndirme
1
22.03.2024 tarihinden bu yana
Son Erişim Tarihi
18 Mayıs 2024 13:34
Google Kontrol
Tıklayınız
Tam Metin
Tam Metin İndirmek için tıklayın Ön izleme
Detaylı Görünüm
Eser Adı
(dc.title)
Davranış Fonksiyonu Tabanlı Derin Pekişt˙irmeli Öğrenme Algor˙ıtmaları Eğitimminde Dağınık Mimari Kullanımı
Yayın Türü
(dc.type)
Tez
Yazar/lar
(dc.contributor.author)
ÇALIŞIR, Cihan
Atıf Dizini
(dc.source.database)
Diğer
Konu Başlıkları
(dc.subject)
DASK
Konu Başlıkları
(dc.subject)
Dağıtık Hesaplama
Konu Başlıkları
(dc.subject)
Pekiştirmeli Öğrenme
Konu Başlıkları
(dc.subject)
Davranış Fonksiyonu Tabanlı Pekiştirmeli Öğrenme
Konu Başlıkları
(dc.subject)
Dağınık İşleme
Yayıncı
(dc.publisher)
KTO Karatay Üniversitesi
Tez Danışmanı
(dc.contributor.advisor)
YUMUŞAK, Semih
Yayın Tarihi
(dc.date.issued)
2023
Kayıt Giriş Tarihi
(dc.date.accessioned)
2023-08-29T13:51:37Z
Açık Erişim tarihi
(dc.date.available)
2023-08-29T13:51:37Z
Tez Türü
(dc.type.thesis)
Yüksek Lisans
Özet
(dc.description.abstract)
Pekiştirmeli öğrenmede eğitimler genellikle zaman açısından maliyetli olup, bu durum karmaşık ortamlarda sorun teşkil edebilir. Bu nedenle dağıtık mimari kullanımı, karmaşık ortamlarda hızlı eğitim için etkili bir alternatif sunar. Veri veya model paralelleştirme yapılarak, pekiştirmeli öğrenme eğitimlerinde dağıtık mimarinin avantajlarından faydalanmak mümkündür. Bu tez çalışmasında, pekiştirmeli öğrenme (reinforcement learning) yöntemlerinde ajanların karmaşık görevlerde uzun eğitim süreleri ile karşılaşma sorunu ele alınmıştır. Önerilen yaklaşım, davranış fonksiyonu tabanlı pekiştirmeli öğrenme metotlarında ortam ile etkileşim kurularak biriktirilmesi gereken tecrübeleri, dağıtık işleme yöntemleri ile çoğaltılmış ortam kopyalarından eş zamanlı ve daha hızlı sağlamaktır. Dağıtık işleme yöntemi için python tabanlı DASK dağıtık hesaplama kütüphanesi kullanılmıştır. Geliştirilen yöntem, mevcut iki farklı yöntemle karşılaştırılmıştır. Alınan sonuçlar, önerilen yöntemin pekiştirmeli öğrenme modellerinin eğitimini hızlandırdığını göstermektedir.
Yayın Dili
(dc.language.iso)
tr
Tek Biçim Adres
(dc.identifier.uri)
http://hdl.handle.net/20.500.12498/6023
Analizler
Yayın Görüntülenme
Yayın Görüntülenme
Erişilen ülkeler
Erişilen şehirler
6698 sayılı Kişisel Verilerin Korunması Kanunu kapsamında yükümlülüklerimiz ve cerez politikamız hakkında bilgi sahibi olmak için alttaki bağlantıyı kullanabilirsiniz.

creativecommons
Bu site altında yer alan tüm kaynaklar Creative Commons Alıntı-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.
Platforms