Ana səhifə

Gezgin Satıcı Probleminin Benzetilmiş Tavlama Yöntemiyle Çözümünde Paralel Hesaplamanın Kullanılması


Yüklə 41.9 Kb.
tarix14.06.2016
ölçüsü41.9 Kb.
Gezgin Satıcı Probleminin Benzetilmiş Tavlama Yöntemiyle Çözümünde Paralel Hesaplamanın Kullanılması

Emrullah SONUÇ1, Baha ŞEN2,Şafak BAYIR3

1 Karabük Üniversitesi, Bilgisayar Mühendisliği Bölümü, Karabük

2 Yıldırım Beyazıt Üniversitesi, Bilgisayar Mühendisliği Bölümü, Ankara

3 Karabük Üniversitesi, Bilgisayar Mühendisliği Bölümü, Karabük

esonuc@karabuk.edu.tr, baha.sen@ybu.edu.tr, safakbayir@karabuk.edu.tr

Özet: Bilgisayar bilimlerinde çözümü zor olan ve çözüme ulaşmak için gereken hesaplamaların bir hayli zaman aldığı problemlerin çözümünde sezgisel yaklaşımlar sergilenmektedir. Bu yaklaşımlara sahip algoritmalar, en iyi çözümü sunmak yerine çözüm zamanını azaltmayı hedefleyerek iyiye yakın çözüm elde etmeyi amaçlar. Bu yaklaşıma sahip olan Benzetilmiş Tavlama algoritması herhangi bir fonksiyonun global optimum değerini elde etmek için kullanılır. Bu sebeple, özellikle matematiksel modellerle gösterilemeyen kombinasyonel problemlerin optimizasyon uygulamalarında tercih edilir. Yapılan çalışmada Benzetilmiş Tavlama algoritması NP-tam zorluğunda olan Gezgin Satıcı Problemi üzerinde seri, CPU üzerinde paralelleştirilmiş ve GPU üzerinde paralelleştirilmiş yöntemler ile test edilmiştir. Çalışmada, paralel yöntemler seri uygulamaya nazaran zaman olarak uygun bir sonuç vermese maliyet açısından daha iyi çözümlerin elde edilmesini sağlamıştır. Sonuçlar maliyet değerleri üzerinden grafiklerle gösterilmiştir.
Anahtar Sözcükler: Benzetilmiş Tavlama, Gezgin Satıcı Problemi, Paralel Hesaplama, OPENMP, GPU, CUDA.

Simulated Annealing Method For Solving Traveling Salesman Problem Using Parallel Computing
Abstract: In computer science, heuristic approaches are used to solve intractable problems. These algorithms aim to get close to the best solutions with less computational effort than that required to get optimal solutions. Simulated Annealing algorithm is one such type of local search algorithm and is successfully used in many combinatorial optimization problems. In this study, Simulated Annealing is tested on Traveling Salesman Problem. This problem is a NP-complete. Algorithm is applied with three methods: serial, CPU-based parallel and GPU-based parallel. Methods are compared on test data. If time is not considered as the only criteria, parallel methods are closer than serial method to the best solution.
Keywords: Simulated Annealing, Traveling Salesman Problem, OPENMP, GPU, CUDA.

1. Giriş

Bilgisayar bilimlerinde çözümü zor olan ve çözüme ulaşmak için gereken hesaplamaların bir hayli zaman aldığı problemlerin çözümünde sezgisel yaklaşımlar segilenmektedir. Bu yaklaşımlara sahip algoritmalar, en iyi çözümü sunmak yerine çözüm zamanını azaltmayı hedefleyerek iyiye yakın çözüm elde etmeyi amaçlar. Bu yöntemler problemin çözümünü garanti etmemekle birlikte genellikle en iyiye yakın bir sonucun çözüm yoluna kısa süre içerisinde erişmektedirler [1]. Bu alanda kullanılan algoritmalardan bazıları şunlardır:




  • Benzetilmiş Tavlama Algoritması (Simulated Annealing Algorithm)

  • Tırmanış Araması Algoritması (Hill Climbing Algorithm)

  • Genetik Algoritma (Genetic Algorithm)

  • Arı sürüsü Arama algoritması (Bees Search Algorithm)

  • Parçacık Sürü Optimizasyonu (Partical Swarm Algorithm)

  • Karınca Kolonisi Algoritması (Ant Colony Algorithm)

  • A* Araması (Astar Search)

  • Açgözlü En İyi Öncelikli Arama (Greedy Best First Search)

  • Işın Arama (Beam Search)


2. Benzetilmiş Tavlama

Benzetilmiş Tavlama (BT) algoritması, özellikle hesaplama alanında kullanılan sezgisel algoritmalardan bir tanesidir. Algoritmanın amacı, çözümü istenen problem için genel iyileştirme (global optimization) elde etmektir. BT, herhangi bir fonksiyonun ya da ölçümün genel minimum veya maksimum (global minimum) değerini elde etmek için kullanılır [2]. Bu sebeple, özellikle matematiksel modellerle gösterilemeyen kombinasyonel problemlerin optimizasyon uygulamalarında tercih edilir [3]. Kirkpatrick ve arkadaşları tarafından 1983 yılında önerilmiştir [4].

BT yüksek dereceli doğrusal olmayan modeller, kaotik ve gürültülü veriler ve birçok kısıtlamalar ile başa çıkabilecek nitelikte olan genel ve sağlam bir tekniktir. Diğer yerel arama yöntemlerine göre başlıca avantajları, esnekliği ve global en iyi çözümü bulma yaklaşımı yeteneğidir. Bu modelin herhangi kısıtlayıcı özelliklere bağlılığının olmamasından dolayı çok yönlülük özelliği vardır. BT metotları kolaylıkla düzenlenebilir bir yapıdadır. Algoritmanın önemli özelliklerin birisi de uygulanacak sistem için verilen optimizasyon algoritmasının performasını artırmak amaçlı yapılacak kod değişikleriyle bunu mümkün kılabilmek ve birden fazla probleme uyarlanabilir hale getirebilme yeteneğidir. Buna karşılık BT, çözümler arasında bağlantılara ve onların hesaplanması için zamana ihtiyaç duyar. Problemi çözmek için gereken hesaplamalarda ve algoritmada hassas parametler olabilir ve ince ayarlar yapmak gerekebilir. Sayıların hassaslığı BT'nin sonucunun kalitesine önemli derecede etki ettiğinden önem arz etmektedir [5].

BT algoritması için kullanılan parametrelerin doğru belirlenebilmesi problemin çözümünde önemli bir rol oynar. BT’de genel olarak 4 ana parametre vardır. Bunlar:



  • Başlangıç Sıcaklığı,

  • Soğutma Katsayısı,

  • Hedef Sıcaklık ve

  • İterasyon Sayısıdır.

BT algoritmasının seri çalışan sözde kodu (pseudocode) aşağıdaki gibidir [6]:



s ← s0; e ← E(s) // İlk durum, enerji.

sbest ← s; ebest ← e // Başlangıçta en iyi çözüm.

k ← 0 // İterasyon sayısı

while k < kmax and e > emax // İterasyon bitene kadar döngüde kal:

T ← temperature(k/kmax) // Sıcaklığın düşürülmesi

snew ← neighbor(s) // Yeni bir konfigürasyon seç.

enew ← E(snew) // Enerjiyi hesapla.

if P(e, enew, T) > random() then // Yeni durum kabul edilebilir mi?

s ← snew; e ← enew // Evet ise mevcut durumu değiştir

if e < ebest then // Enerji daha düşükse en iyi çözüm yap.

sbest ← snew; ebest ← enew // Mevcut durumu en iyisiyle değiştir

k ← k + 1 // İterasyon sayısını artır.

return sbest // En iyi durum bulundu.



3. Gezgin Satıcı Problemi

Gezgin Satıcı Problemi (GSP) bir seyyar satıcının elindeki ürünleri n şehri dolaşarak satmak istemesinden oluşmaktadır. Satıcı tüm şehirlere mümkün olduğu kadar en kısa yoldan ve maksimum bir kez uğrayarak turunu tamamlamak istemektedir. Problemin çözümündeki amaç ise satıcıya en kısa yolu sunabilmektir.

Problem  şehirden oluşuyorsa (,  =1, ...,) her tur 1’den ’e kadar olan sayıların permütasyonu olarak ifade edilebilir [7].

 ve  arasındaki mesafe:



(1)

Verilen permütasyonda  ve komşu şehirlerdir. Permütasyon toplamı aşağıdaki gibi minimize edilebilir [7]:



(2)


Bu durumda çözüm uzayının boyutu
’dir [7].

Bu problem, 1930'lu yıllarda matematiksel olarak formüle edilmiştir. Optimizasyon konusunda başı çeken konular arasında yer alır. "Hesaplamanın karmaşıklığı" teorisine göre çözümü NP-Tam (NP-complete) olan en önemli algoritma problemlerinden biridir. Bundan dolayı bu problemleri tam bir şekilde çözebilecek bir algoritma olmadığı kabul edilmektedir. Şu anda çözülmeye çalışılan en büyük problem dünya üzerinde kayıtlı yerleşimi olan her nokta için en kısa yol problemidir. Bu problem 1.904.711 şehir içermektedir [8].

Çok şehirli GSP’leri çözmek için yaklaşık çözüm üreten sezgisel algoritmalar kullanılmaktadır. Sezgisel algoritmalar, en iyi çözüm hakkında herhangi bir garanti vermemelerine karşılık, en iyi çözüme yakın iyi bir sonucun makul bir sürede bulunmasını sağlarlar [9].

4. GSP’nin BT İle Çözümü

GSP’nin BT ile çözümü seri, CPU (Central Processing Unit) üzerinde paralel, GPU (Graphics Processing Unit) üzerinde paralel olmak üzere 3 yöntem ile çalıştırılmıştır.

4.1 Seri Algoritma İle Çözüm

BT algoritmasının seri kodlanması sırasında GSP’ye uyarlanırken yapılan adımlar şunlardır:



  1. Şehirlerin koordinat bilgilerinin tutulacağı diziler oluşturulur.

  2. Her iterasyonda, iki şehir rastgele yer değiştirilir. Daha sonra maliyet hesaplanır ve bir önceki maliyet ile karşılaştırılır.

  3. Maliyet düşükse yer değiştirme direkt olarak onaylanır değilse belli bir olasılık dahilinde yer değiştirme iptal edilir.

  4. Her iterasyonda sıcaklık belirli bir katsayı ile düşürülür.

GSP için veri seti olarak TSPLIB kütüphanesinde bulunan Berlin52 veri seti kullanılmıştır [10]. Berlin52 veri seti için en iyi çözüm değeri 7542’dir. Seri çalıştırılan programda BT’ye ait parametreler değiştirilerek probleme uygun hale getirilmeye çalışılmıştır. İterasyon sayısı olarak 1000 belirlenmiştir. Her iterasyonda yaklaşık 30000 adım test edilmiştir. Toplamda 92 adımda maliyet indigenmiş, sonuçlar grafik olarak Şekil 1’de gösterilmiştir. En düşük maliyet 9417 olarak bulunmuştur. Programın parametre değerleri ise şunlardır:

  • Başlangıç Sıcaklığı = 1000000000,

  • Soğutma Katsayısı = 0.999,

  • Hedef Sıcaklık = 0.0001,

  • İterasyon Sayısı = 1000.




Şekil 1. BT’nin seri çalıştırılması sonucunda elde edilen maliyet değerleri.

4.2 Paralel Algoritma (CPU-OpenMP) İle Çözüm

CPU üzerinde paralelleştirme çalıştırmaları yapılmadan önce BT’nin paralel versiyonları incelenmiş ve en optimum paralel algoritma üzerinde kodlama çalışmaları yapılmıştır. Bu algoritmanın çalışma prensibi şu adımları içerir [11]:



  1. Başlangıç sıcaklığı T ve ilk konfigürasyon E ile algoritma ayarlanır. T ve E değerleri her bir iş parçacığına gönderilir.

  2. Her bir iş parçacığı seri bir şekilde BT algoritmasını çalıştırır ve maliyet hesabı yapar.

  3. Her bir iş parçacığı işlemini tamamladıktan sonra elde ettiği değeri ve konfigürasyonu ana iş parçacığına gönderir. Burada en düşük enerjiye (maliyete) sahip değer ve konfigürasyon karşılaştırma yöntemiyle ya da belirlenen bir algoritma yardımıyla belirlenir.

  4. Elde edilen yeni konfigürasyon tekrar iş parçacıklarına dağıtılır. 2. ve 3. adım sıcaklık değeri hedef sıcaklığa indirgene kadar tekrarlanır. Algoritma bu şekilde sonlandırılır.

Bu prensibe göre kodlama yapılarak model CPU (Intel(R) Core(TM)2 Duo CPU P8700 @ 2.53GHz) üzerinde 8 iş parçacığı ile program çalıştırılmıştır. OpenMP [12] teknolojisi kullanılarak gerçekleştirilen uygulamada sonuçlar Şekil 2’te gösterilmiştir.



Şekil 2. BT’nin CPU üzerinde paralel çalıştırılması sonucunda elde edilen maliyet değerleri.


CPU üzerinde paralelleştirme çalışmalarında seri algoritmaya nazaran ikinci adımda hesaplanan maliyet ilk maliyete göre yarı yarıya düşmüştür. Böyle bir sonuç çıkmasındaki sebep iş parçacıklarının ayrı ayrı hesap yapması ve buna bağlı olarak düşük bir maliyetin elde edilme olasılığını arttırmasıdır. Toplamda 20 adımda maliyet indigenmiş, bu indirgeme durumlarının farklı iş parçacıkları tarafından elde edildiği görülmüştür. En düşük maliyet 8099 olarak elde edilmiştir.

4.2 Paralel Algoritma (GPU-CUDA) İle Çözüm

GPU’nun CPU’ya nazaran en önemli özelliği çekirdek sayılarının fazla olmasıdır. GPU’nun binlerce iş parçacığı aynı anda işlem yapabilmekte ve paralel hesaplamaya uygun dizayn edilmesi neticesinde verimli sonuçlar elde edilebilmektedir.

GPU (NVIDIA GeForce G105M) üzerinde yapılan çalışmada CPU tarafında kullanılan algoritma temel alınmış GPU’ya ait özellikler de kullanılarak verimli bir uygulama yapılması amaçlanmıştır. Algoritmanın çalıştırılması esnasındaki GPU’daki iş parçacığı sayısı CPU ile karşılaştırma açısından 8 olarak belirlenmiştir. Uygulama CUDA [13] teknolojisi kullanılarak kodlanmış rastgele sayı ataması yapılırken CUDA teknolojisine ait CURAND [14] kütüphanesinden yararlanılmıştır. Bu sayede algoritmadaki rastgelelik oranının artması öngörülmüştür. Algoritmanın çalıştırılması sonucunda en düşük maliyet 7976 olarak bulunmuştur. Toplamda 5 adımda maliyet indirgenmiş ve en düşük maliyet 25. Adımda bulunmuştur. Daha sonraki yaklaşık 975 adımda daha uygun bir sonuç elde edilememiştir. Bu açıdan bakılacak olursa GPU’daki hesaplama yetenekleriyle sonuca daha az adımda erişilmiştir.




Şekil 3. BT’nin GPU üzerinde paralel çalıştırılması sonucunda elde edilen maliyet değerleri.


Yapılan çalışmalardaki ilk amaç maliyeti düşürmek olduğundan süreler kriter olarak değerlendirilmemiştir. Gerek CPU’da gerekse GPU’da uygulanan paraleleştirme seri uygulamaya nazaran uzun sürmüştür. GPU tarafında kullanılan teknolojinin son teknoloji olmaması ve değerlendirilen veri setinin küçük boyutlu olması bunda etkendir.

4. Sonuç ve Öneriler

Sonuca bakılacak olursa BT algoritmasının bu tarz problemler için uygun bir yöntem olduğunu söylemek mümkündür. Ayrıca problemin çözümüne göre uygun parametreler belirlemek optimum çözüm elde etmek konusunda etkilidir. İterasyon sayısının artması yani algoritmayı birden çok kez çalıştırmak daha iyi sonuçların elde edilmesine imkan sağlamak ile birlikte zaman problemini ortaya çıkarmaktadır. Çözülecek problemin boyutu arttıkça zaman problemi de büyük bir problem haline gelmektedir. Bu yüzden paralel çalışmaların bu konudaki çözümleri önemlidir.



5. Kaynaklar

[1]http://tr.wikipedia.org/wiki/Sezgisel_algoritma


[2]http://bilgisayarkavramlari.sadievrenseker.com/2009/11/23/simulated-annealing-benzetilmis-tavlama/
[3] http://www.yapay-zeka.org/modules/wiwimod/index.php?page=Simulated+Annealing
[4] Kirkpatrick S., Gerlatt C. D. Jr., Vecchi M.P., “Optimization by Simulated Annealing”, Science, 220, 671-680, (1983).
[5]http://163.18.62.64/wisdom/Simulated%20annealing%20overview.pdf
[6]http://en.wikipedia.org/wiki/Simulated_annealing
[7] http://www.ida.liu.se/~petel/
[8]http://en.wikipedia.org/wiki/Traveling_salesman_problem
[9]http://www.matematikdunyasi.org/arsiv/PDF/03_3_37_40_GEZGIN.pdf
[10]http://www.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95/
[11]http://www.ccs.neu.edu/course/com3620/projects/simul_annealing/parallel-final-report.doc

[12]http://openmp.org/wp/


[13]http://www.nvidia.com/object/cuda_home_new.html
[14]http://docs.nvidia.com/cuda/curand/





Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©kagiz.org 2016
rəhbərliyinə müraciət