Süper Bilgisayarlar

Önsöz
Süper bilgisayarlar 1980’lerin başlarında kendi varlıklarıyla tanındılar. Popileritelerinin artmasının belli başlı 4 nedeni şunlardır;
1. Yüksek performans için ileri teknoloji artışı gerekliydi.
2. Gelişen aletlerin daha iyi bilgisayar yapmaya izin vermesi
3. Vektör yöntemi ile ani bir artış meydana geldi.
4. Yeni nesil yöneticilerin süperbilgisayarların kapasitelerinin farkında olmaları.
Sınırlamanın rahatsızlığı ,endüstri standartlarından doğmaktadır;bunlar;temel silikon mikrodevreler ,VON NEOMANN ardışık mimari operasyonları v.g. etkenler bilgisayar performansını ilk bilgisayar zamanındakinden şimdiye doğru gitgide arttırmıştır.
YÜKSEK HIZLI BİLGİSAYARLARIN ORGANİZASYONU
Algoritma ,ilkel altyordamın ardışık anlamıyla bir birleşimin tanımlanmıştır. Algoritma ilkel altyordamın belirtilmesinden ve onun ardışıklığından meydana gelir.
Algoritmanın bir çeşidi altyordam kompleksliğin basit aritmetik operasyonlardan ayrıntılı fonksiyonlara doğru bazı derecelerinden oluşur. Tanecikli yapı eğer algoritmalardaki ilkelse iyidir ve eğer kompleks ise bir yöntemdir.
a-ardışıklık
şekil-1 ‘de gösterildiği gibi bir komut tek zamanda işleniyor. Bu organizasyon FIYNN tek komut akan/tek veri akışı olarak adlandırılır(SISD). Makinenin tekrar cevap vermesi basittir: bu verileri ve programları depolamak için bir hafızaya,aktif komutu işlemek için bir operasyon bölümüne ,işlemleri kontrol için bir kontrol bölümüne ,işlemin yerini izlemek için bir program sayıcısına ve mekanizmayı güncellemek için bir basit program sayıcısına sahiptir. Bileşenler arasındaki ara bağlantı oldukça basittir. Sistemin hızı onun ardışıklık kapasitesine göre sınırlanır ve hangi komutun işleneceği zamanın belirlenmesine bağlıdır.
Önemli bir ardışıklık yaklaşımı avantajı ;çoğu algoritmalar ve programlar bununla gelişmiştir. Büyük programların bulunduğu bir veritabanı ,basitleştirilmiş programlama tecrübesi ve programlama dillerinin metotlarının olgunlaşmasına uygun yer sağlar.
Bağlı olmayan komutların eş zamanlı işlenmesi iki tamamlayıcı yoldan yapılabilir: başka işlemcilere sahip olarak ,biri her komut için ,veya bir işhattı işlemcili ve işhattı tekrarlayıcı operasyonları olan bir sistemin içine girişlerini yoluna koymaya yarayan genel bir tekniktir. Bu şu gerçek temele dayanır. Sistem parçalara bölünür önceki bitmeden önce yeni operasyon başlayabilir. Böyle ileri-giriş bütün sistemin gecikmesi yerine en yavaş bölümün gecikmesi tarafından gecikme miktarına karar verilir. bu yaklaşım alıp getirme ,kodunu çözme ,adres hesaplama,operand alıp getirme gibi bazı basmakları içeren bir komut işlemesine kadar komutları işlemede kullanılır. En yüksek-hızlı işlemciler bu tekniği kullanır.
İleri-bakış yöntemi ile bulunan hız-yükseltme şu faktörlere dayanır:
1. Programdaki elde hazır olan eşzamanlılık miktarı. Böyle olan tipik programlarda veriye bağımlılık miktarı şaşırtıcı derecede küçük,bu yüzden eşzamanlılığın yüksek miktarı ele geçirilebilir. Başka bir taraftan,kontrol bağımlılığı,şartlı dallanmalara yeniden cevap verebilme çok yaralıdır ve olabilecek eşzamanlılığı kullanma mümkünatını sınırlandırır. Bazı bilgisayarlar bir karar verilmemiş dallanmanın ötesinde ileri bakma mekanizmasına sahiptir. Bunlar komutları her parça içerisinden alıp getirirler veya tercih edilen parça içerisinde dallanma tahmini kullanırlar ,adresleri hesaplar , dallanma karar verilene kadar operandları alıp getirirler ve komutları depolamadan işlerler .
2. Kontrol ünitesinin bağımlılığı keşfetme kapasitesi. Eğer çok sayıda eşzamanlılık keşfedilirse,kontrol ünitesi daha kompleks olmak zorundadır. En yeni yüksek hızlı makineler eşzamanlılığı keşfetme kompleksliliğini sınırlandırıyorlar. Çünkü şartlı dallanmalarla alçaltma sağlama,komplekslik eklemeyi çok cost-effective yapmaz.
3. İşhatlı işlemcilerin kapasitesi ve/veya bazı komutların eşzamanlı işleyen fonksiyonel bölümlerin kapasitesi. Çoğu öne-bakan işlemci işhatlı yaklaşımı kullanırlar.
4. Komutları ve veri gereksinimlerini aktif halde tutan işlemcileri sağlayan yüksek-bant genişliğine sahip hafıza kapasitesi. Hafızanın genellikle işlemciden daha yavaş olmasından dolayı bant genişliliği bunu başarabilmek için eşzamanlı giriş yapabilen bir model seti gibi hafızanın bir organizasyonuna ihtiyaç duyar. Maksimum bant-genişliği bağımlılığında adres akışından ve O-O-O(out-of-order) gereksinimlerini sağlama olabilirliliğinden bulunur.
b- grup-ardışıklığı
grup-ardışıklığının içerisinde ,altbağdaştırma gruplar halinde düzenlenir ve ardışıklık ,bir grup içerisindeki altbağdaştırma gibi eşzamanlı işlenebilir fakat gruplar ardışık olarak işlenmelidir. SIMD algoritma yapısına uyan programları işlemekte ;iki bilgisayar organizasyonu kullanmaktadır: vektör ve array(sıra) bilgisayarları. Bir vektör bilgisayarda ,grup dahilinde altbirleşim işhattı işlemcilerinde bazı array bilgisayar işlemcisi içinde kullanılma süresince işlem görürler.
Bir vektör bilgisayar şekil-2 deki gibidir. Veriler ,veri hafızasında depolanır ve işhattı tarzında performans gösteren operasyonların olduğu vektör işlemcisindeki akım içine transfer edilirler ve sonuç akım hafızaya tekrar gönderilir.
Bir adres doğurucu hafızadaki veri kontrol eder ve bir vektör kontrolcüsü vektör operasyonunun paremetrelerini kontrol eder. Bazı organizasyonlarda ,kaydedicinin yüksek sayısı vektörleri depolayan işlemcinin içinde kullanılır ve hafızaya transfer miktarını azaltır.
Bu bilgisayarlar ayrıca scalar komutları işlemek için bir scalar işlemciye sahiptirler.
Vektör bilgisayarlar işhattı hızına,kaydedici sayısına ,adres doğurucunun karakteristiklerine,bant genişliğine ve hafızanın organizasyonuna ve scalar işlemcinin yeteneğine bağlı olarak farklılaşır. Bununla beraber bir sistemin performansını düşüren ve maksimum içegirişleri tam olarak iyi yapmasının bazı nedenleri vardır.
Bu faktörler;
1. Vektör operasyonunun kurulması esnasındaki genel masrafları. Parametreler vektör kontrolcüsüne ve adres doğurucusuna gönderilmelidir ve işhattı özel bir operasyon için hazır olmalıdır. Bunlar ekstra scalar komutlarının işlenmesinin bir gereksinimleridir.
2. Veri hafızasında çekişme. Yüksek-performans ardışık işlemci içindeki gibi ,makul bir bantgenişliği başarmak ,hafıza modüllere bölünür ve bu modüller eşzamanlı giriş yaparlar. Bantgenişliği vektör unsuru her modülün bulunduğu zaman maksimum olur. Bununla beraber bazen vektörü hafızaya depolamada bu aktif olmayabilir bu yüzden ardışık elemanlar farklı modüllerde oluyorlar ve aktif hafıza bantgenişliğindeki bir azalma sebebi çekişebiliyor.
3. Adres modeli gereksinimi ve adres adres doğurucunun yeteneği arasındaki mismatch. Örneğin algoritma bir değişken uzun adımı gerektirebilir ve jenaratör sadece ayrılmış uzun adımları kullanabilir.
4. Scalar ve vektör operasyonu arasındaki bağımlılık.
5. Etkisiz operasyon bölümleri. Programın bir uygun operasyon karışımı kapsaması önemlidir.
Diğer vektör komutlarını işlemenin diğer bir yoluda array bilgisayarlardır. Daha öncede bahsedildiği gibi ,bazı komutları merkezi bir kontrol altında birkaç işlemcide işlenilir. İşlemci verileri merkezi bellekten bir bağlantı network’una doğru girdirilir. Bir scalar işlemci scalar komutları program süresince işler.

P işlemcili bir array bilgisayar bir unprocessor sistemli p’nin hız artışını sağlayabilirler. Bununla beraber bazı azaltılmış(aşağılayıcı) faktörler gerçek hız artışına karar verirler.
1. Vektörlerin bileşenlerinin sayısı,işlemcinin sayısı çokluğunda değilse bazı işlemciler boşta kalır,bu da giriş sayısını azaltır.
2. Bazı tipik algoritmalar vektör komutlarıyla üst üste gelmeyen scalar komutlara sahip olabilirler. Bu array işlemciyi bir scalar komut işlenene kadar işsiz bırakır.
3. Burada hafızadan vektör girişindeki karışıklıktır. Vektör bilgisayarlar gibi,burada da hafıza ayrılmıştır ve eğer birden fazla bileşen modülden giriş yapılmış olursa bu karışıklık meydana getirir
4. Network bağlantısında sınırlandırmalar. Veri bellek modüllerinden birebir karşılığı olan işlemciye aynı anda transfer edilmek zorundadır. Bunu bir anahtar seviyesindeki çift bellek-işlemcisinde yapmak karşılıklı çalışan bir anahtar gerektirir. Bununla beraber bağlantının maliyeti modülleriyle ve işlemci sayısının ürünlerini arttırır.
Grup-ardışıklık algoritmasının daha genel tipi komutların grup veya farklı olduğu PRIPHERAL ARRAY İŞLEMCİLERİ(PAP) içinde kullanılır ve çok uzun komut kelimesi (VLİW) içinde kullanılır. İsimde belirtildiği gibi ,PAP host bilgisayarlarla ilgilidir ve özellikle eşzamanlılık içinde işhattında aritmetik operasyonları işlemede kolaylık sağlar. İçindeki tanımlanmış özel bir bölümde array ve vektör işlemcilerinden ayrılır. Vektör operasyonları içeren bir makine dilindeki programı işlemek yerine işlenmiş olan özel algoritma mikro-programlamadır ve işlenen vektör operasyonuna etkisi ,işhattı operasyon bölümündeki uygun zamanlama ile bulunur.
PAP vektör ve array bilgisayarlardan daha az ücrete sahiptir.
VLİW mimarisi ,diğer bir deyişle ,daha fazla eşzamanlılık elde eden ardışık programların dönüşümüyle sağlanan grup-ardışık programları işler. Öne-bakış şartlı dalmaların yüksek sayılarında uygun giriş içinde artış sınırlandırmasını sağlar. Bunun üstesinden gelen ,bir teknik trace scheduling diye adlandırılan ve dallanma dışında uzun ardışıklıkla bir ardışık programa dönüştürme tasarımını yapar.
c- üstünkörü – çifte akış
Eşzamanlı komut işlemeyle hız artışı sağlamanın diğer bir yoluda üstünkörü-çifte akış algoritmasıdır. Bu yapıda ,algoritma akış içinde çok sık olmayan bağlantı ile bazı ardışık akışlardan oluşur. Her akış bağlantı kontrolünü haberleştiren bir ayrı ardışık işlemci içinde işleyebilir. Bu yapıyı işlemeye uyan bilgisayar organizasyonu multiprocessor diye isimlendirilir. Bu organizasyon tipinin önemi ,eşzamanlı ve işlemciler arası bağlantı mekanizmasıdır. Özel mekanizma kullanımı yönünden iki sınıfa ayırabiliriz. Birincisi bellek paylaşım kullanımı,diğeri ise mesaj kullanabiliriz. Paylaşılmış bellek kullanımı hızlı bir mekanizmaya sebep olur,fakat bütün işlemcilerin paylaşılmış hafızaya girişi şarttır,buda işlemci sayısını sınırlandırır. Diğer taraftan mesaj üzerine temellendirilmiş mekanizma büyük masraflara sahiptir. Bu yüzden senkronizelik ve haberleşmenin çok az sıklıkta olduğu yerlerde kullanışlıdır.
Bellek bütün işlemcinin içine paylaşılmıştır. Bağlantılı network içindeki gecikmeye ve bellek girişine müdahaleyi geciktirir. Genellikle
yüksek-bant genişliğine sahip bağlantı network’una gereksinim duyulur ve bu bellekteki etkiyi azaltacak şekilde olmak zorundadır. Bazı bağlantı network’leri ,bant-genişliği ,gecikme süresi ve ücret gibi farklı özelliklerde sunulmuşlardır.
Sistemin baştan başa performansı ,bellek giriş sıklığını,bağlantılı network’lerde gecikme ve bellek etkileşimini hesaba katar.
Network bant-genişliğinin gereksinimlerinin azaltmanın bir yolu her işlemciyi birleştiren bir cache’e sahip olmaktır. Bu yaklaşımın ana problemi,paylaşılmış bazı cache’ler içinde aynı anda gözükmesinden ortaya çıkan tutarlılık problemidir.
Bu problemin bir çözümü de ;muntazam girişler sürerken seviyeye yakın yerel hafıza olarak fiziksel parçalara ayırmaktır.
Bu yaklaşımla ,dış belleklere girişler sırasında ilave gecikmeler gelir. Eğer ,kod içinde anlamlı yerleşim varsa ve işlemci tarafından veri işlendiyse uygun olabilir. Her ilave bağlantı network’ü maliyetini düşürmek için ,işlemci kümelere bölünebilir ve kümeler arası daha yavaş bir bağlantıya sahip olunabilinir.
Eşzamanlı mekanizmalar ,çok-yönlü programlanan sistemlerde kullanılanlara benzer.
Diğer bir taraftan,mesaj-temelleme bağlantılı mekanizmalar ,daha fazla işlemcili sistemlerde kullanılmak üzere tasarlanmıştır. Bu sebepten dolayı crossbar anahtarlama bağlantı network’ü gibi uyumlu değildir. Bunlar ,bunun bedelinden ,modülleme eksikliğinden ve birçok yönlü yolun genellikle daha fazla müdehale meydana getirmesinden dolayıdır.
Eşzamanlılık mekanizmaları mesaj şebekesi üzerine temellenmiştir ve yüksek bir overhead’a sahiptir.,bundan dolayı paylaşılmış bellek gibi adlandırılırlar.
P işlemcisi ile bir multiprocessor ile ele geçirilebilen hız yükselmesi p’dir bununla beraber aşağıdaki alçaltıcı faktörler gerçek bir hız artışı kaybına yol açarlar.
1. algoritma içerisindeki hazır aynı anda çalışma miktarı,bu eşzamanlı çalışabilen işlemcilerin sayısıdır. Eğer miktar p’den azsa bütün işlemciler meşgul olmaz.
2. Çarpışmalar ve bellek girişlerindeki gecikmeler. Bu bellek alanının aktif kullanımını azaltır.
3. Eşzamanlı mekanizmalardaki akışlar arasındaki overhead.

d- genel eşzamanlılık
Akışlar arasındaki bağımlılık sıklığı anlamlı bir şekilde arttırılırsa ,algoritma yapısı karakter uygunluğunda general-concurrent tipine dönüşür. Bu yapı en fazla hız ve eşzamanlılık için olabilirliği sağlar. Bununla beraber bu sistemdeki programın takdim edilişinde ve ardışıklığın kontrolünde ve overhead ayarlamasında anlamlı bir etkisi vardır. Öncekilerin ışığında ,programın temel çizgiselliğine uygundur. Sunum içerisinde tam ardışıklığı kullanmak mümkün olabilir. Bu genel eş-zamanlılıkta aktif değildir çünkü burada izlenen yol zaten lineer bir ardışıklığa sahip değildir. Bu program sunuş kompleksliğinin anlamlılığını arttırır.
S.Fernbach(editor),SUPERCOMPUTERS

SÜPER BİLGİSAYARLARDA PARELLİK
VE BİLGİSAYAR GELİŞİMİ

Bir paralel bilgisayar,bir hesapsal problemi çözebilmek için işbirliği halinde çalışabilen işlemcilerin kurulumundan oluşur. Bu tanımlama yüzlerce veya binlerce işlemciye ,network’ün çalışma-istasyonuna ve çok-yönlü işlemcili workstation’ lara ve yerleşmiş sistemi olan paralel süperbilgisayarları kapsamak için geniş bir tanımlamadır. Paralel bilgisayarlar çok ilgi çekicidir çünkü yoğunlaştırılmış hesapsal kaynak potansiyeli sunar.
Paralellik hazır hale geliyor ve paralel programcılık,programlama girişimlerinin merkezi hale geliyor.
1.yaklaşımların trendi
Bilgisayarların daha hızlı olmasıyla,daha cezbedici olabilir ve doyurucu hesaplama gücü artışı için arzulanmasını ve yeterince hızlı olduğunun sanılmasını sağlar. Bununla beraber yeni müracaatlar bu teknolojinin gelişmesini talep edecektir ve bu teknolojiye olanak sağlayacak yeni yaklaşımlar baş gösterecektir. Bu eğlendirici görgünün bir eğlendirici örneklenmesi gibi,British hükümeti için 1940’larda hazırlanan bir raporda GREAT BRİTAİN’ın hesapsal gereksinimlerinin 2 yada 3 bilgisayara toplanmasına karar verildi. Bu günlerde,bilgisayarlar öncelikle balistik tabloların hesaplanmasında kullanılıyordu. Bu raporun yazarları ,diğer bilim,mühendislik gibi müracaatları düşünmediler ,daha sonra hesaplamayı idaresi altına alan ticari müracaatlara izin verdiler.
Geleneksel olarak,hesaplamaların son durumundaki gelişmeler,hava,iklim,makine aletler,elektronik devreleri,işlemci imalatı ve kimyasal gibi kompleks sistemlerin numarasal simülasyonları tarafından motive edildi.
Bununla beraber ,günümüzde hız artışlarını kontrol eden daha anlamlı güçler bilgiç bir yoldan çok büyük sayıda veriyi işleyebilen bir bilgisayar gerektiren ticari müracaatları meydana getirirler. Bu müracaatlar konferansları,işbirliksel çalışma çevrelerini,bilgisayar ilaç tesislerini sağlar ,paralel veri tabanları desteklemeleri karar için kullanılır ve gelişmiş grafikler ve görsel gerçekleri ,özellikle eğlence endüstrisini de kapsar. Örneğin ,paralel hesaplamayı bütünleyici olarak,yüksek performanslı network’ler ve multimedya teknolojileri video sunucularının gelişimini yönetir ,bilgisayarlar eş-zamanlı video için eşzamanlı video için eşzamanlı gereksinimlerin yüzlercesini veya binlercesini sunmak için dizayn edilirler. Her video akımı,her saniye başına kaç megabayt olacağının veri transfer oranını ve şifreleme ve şifre çözme için işleme yüksek miktarlarını kapsayabilir.
Bununla beraber ,ticari müracaatlar paralel bilgisayarların çoğunun mimarisini tanımlayabilirler ,geleneksel bilimsel müracaatlar paralel hesapsal teknolojilerin önemli kullanıcıları olarak kalacaklardır. Hesapsal değerler tipik olarak 4.güç veya doğruluğuna karar veren kararlılığın daha fazlası gibi arttırır. Bu yüzden çalışmaların daha fazla hesaplama gücü için açgözlü talepleri vardır. Bunlar bundan başka sık sık çok büyük bellek ve I/O gereksinimiyle karekterize edilir.

2-bilgisayar tasarımı trendi
En hızlı bilgisayar performansları 1945’den şimdiye kadar düzenli olarak artmıştır. İlk bilgisayarlar onlarca floating-point operasyonu yapabilirken ,paralel bilgisayarlar 1990ların ortalarında 10 milyonlarca operasyonu tek saniyede yapabilmeyi başarmışlardır( Şekil 2.1). Aynı şekildeki bir trend low-end bilgisayarları farklı bir bölgede gözlemlenmiştir :hesap makineleri,kişisel bilgisayarlar ve workstation’lar. Burada küçük bir etki vardır bu da bu gelişmenin devam etmeyeceğidir. Bununla beraber bilgisayar mimarilerinin bu gelişime destek vermesi radikal olarak değişiyor ,ARDIŞILLIKTAN PARELELLİĞE DOĞRU

Şekil 2.1; bazı en-hızlı bilgisayarların performansının zirvesi . 1945—1995 . 1980’lerde duraksasa da tekrar irice paralel bilgisayar hazır hale geldi. Buradaki “o” uniprocessors, “+”lar ılımlı paralel vektör bilgisayarlar 4—16 işlemcileride göstermektedir ve “x”ler yüzlerce veya binlerce paralel işlemcili iri paralel bilgisayarları göstermektedir.
Tipik olarak ,irice paralel bilgisayarların doruk performansları az bir oranla vektör bilgisayarlardan daha iyidir.
Resim-2.2
Bir bilgisayarın performansı doğrudan ,temel bir işlemi yerine getirmek için gereksinim duyduğu zamana ve eşzamanlı olarak işlem gördüğü zamana bağlıdır. Bir temel operasyonun zamanı eninde sonunda işlemcinin “saat saykılı” ile sınırlanır. Şöyle ki; zaman daha çok ilkel operasyonların performansında gereksinim duyulur. Bununla beraber ,saat saykılı zamanı yavaşça azalıyor ve ışık hızı gibi fiziksel sınırlara yaklaşıyor gibi gözüküyor. Biz ,hesapsal performans artışı sağlanması için daha hızlım işlemcilere bağlı olmalıyız.
Resim 2.2; bilgisayarın saat saykıl zamanlamasının trendi .(“o”>geleneksel vektör süper bilgisayarların saykıl zamanlaması),CRAY-1 ‘in (12.5ns)den c90(4.0)’a kadar ,RISC mikroişlemcileri (“+” ile gösteriliyor) aynı performansa (hız olarak) yaklaşıyorlar. Her iki yapıda fiziksel limite yaklaşıyor gözüküyor.
Bu sınırı atlatabilmek için ,dizayn edenler bir çip içinde dahili eşzamanlılıktan yararlanmaya kalkabilirler. Bununla beraber ,çok büyük dereceli integrasyon (VLSI) kompleksliği teorisi içindeki temel neden bu stratejinin pahalı olduğunu söyler. Ciddi geçişli hesaplamalar bu sebep şunu ileri sürer(her çıkışın her girişe bağımlı olabilmesi ) ,çip alanı A ve zamanı T bu hesaplamalarda bağlantı kurmaya gereksinim duyar. Bu yüzden bazı bu problem boyutunun bağlı görev problemini aşmalıdır. Bu sebep bir kere çipin bir tarafından diğerine kesin bir bilgi miktarını bir hesaplamanın göndermesinden farz edilerek resmi olmayan bir açıklama olabilir.
Bir zamanlama birimi içinde gönderilebilen bilgi miktarı bir çipin karşı bölümleri tarafından sınırlandırılır. Aralarında ilişki bulunandan bir transfer oranı verir. Bir kesin faktör tarafından bilgilerin gönderilmesinde zaman gereksinimini azaltmak için,karşı bölümler aynı faktör ile azaltılmalıdır ve bundan dolayı bütün alan bu faktörün karesi tarafından azaltılmalıdır.
Bu sebebin anlamı yalnızca bu değil ;daha hızlı idarenin paralarının tek inşa etmenin zor olduğudur. Böyle yapmak bundan dolayı çok çekici değildir. Daha yavaş parçalar kullanmak daha ucuz olabilir. Örneğin ,eğer biz bir bilgisayarda kullanmak için slikon bir alana sahipsek,biz ayrı parçalar kurabiliriz, her birinin boyutu A ve bir operasyonu işleme zamanı T olabilir ,veya tek bir parça kurabiliriz ve bu T/n zamanda işlem yapılabilir. Çok yönlü parçalar sistemde n kere daha hızlıdır.
Bilgisayar dizayn edenler tek bilgisayar performansındaki sınırlamanın üstesinden gelmek için değişik teknikler kullanırlar. İşhatlarını (farklı bölümlerde bazı komutların eşzamanlı çalışması ) ve çok yönlü fonksiyon bölümlerini kullanırlar. Artarak ,dizayncılar her birisi kendi işlemcisine ,belleğine ve bağlantı birleştirme devresine sahip olan bilgisayarları kapsıyorlar. Bu yaklaşım bir bilgisayarı meydana getirmek için gerekli olan parça sayısını azaltmaya devam eden VLSI teknolojisi içindeki ilerleme tarafından kolaylaştırılmıştır. Bir bilgisayarın fiyatı (yaklaşık olarak) içerdiği parça sayısıyla orantılıdır ve bu maliyet ayrıca işlemci sayısını arttırır ki bu işlemciler bilgisayar için belirli bir fiyata sahiptir.

şekil 2.3; paralel bilgisayarlardaki işlemci sayısı (“o”) ve vektör çokyönlü işlemcileri (“+”)
http:// www-unix .msc-an1.1 parellism and computing

YÜKSEK-PERFORMANSLI HESAPLAMA

Bilgisayarlar günümüzde bir çok evin ortak kaynağıdır. Bunlar kişisel bilgisayarlardır ve çok hızlı gelişmektedirler ve hayatımızda büyük yer tutmaktadırlar. Örneğin bir bilgisayar oyunun en iyi grafik ve daha hızlı aksiyonlarla düşünün. Şimdi sizin komşunuz kendi bilgisayarını bu oyunu oynamasında yardım etmeniz için getiriyor. Bütün işlemcileri ,bellekleri ve harddiskleri beraber yerleştirin ve işte çok yüksek hızlı bir bilgisayarınız oldu. Yüksek-performanslı bilgisayarların özel bir tipi paralel işlemcili makinalardır. Bilgisayarın kaynakları işlemcileri(beyni) ve belleğidir. Bunlar ayrı ayrı ortak goal için çalışırlar. Bununla beraber tabiki oyunlar toplumun gerçek problemleri değil. Gelişmiş tıbbi tedavileri,hava tahminleri ve çevresel düzenlemelerde hayırlıdır ve HPC(high performans computer) toplum için kullanılır.

http://zorba.uafadm.alaska.edu

Yüksek performanslı hesaplamalar 1990’larda denenmiştir ve inanılmaz bir performans artışına sebep olmuştur ve temel bir tenoloji geçişi sağlamıştır.
Performans 1000 kat yükselmiştir,1 milyondan 1 trilyon floating-point operasyonu tek saniyede gerçekleşebilmiştir.
Süper bilgisayarlar vektör işlemcilerle ve paylaşılmış bellekle imal edilmişlerdir; 2000’de ise mikroişlemciler 1000’lerce paralel işlemciler ile dağınık makineler halinde birleştiriliyorlar.
HORST D.Simon,http://supercomp.de/

Soru: how speed can be provided by supercomputer?
Cevap:
Süper bilgisayarlar birçok işlemciye sahiptir,buda işlerin paralel bir şekilde yapılmasına fırsat tanır. Aslında eğer program ardışık değilse bir hız artışı sağlanamaz. Eğer kod iyi bir şekilde parelelize edildiyse ,yüksek bir hız artışına sahip olabilirsiniz. Örneğin bir işi 1 işlemci ile 10 saykılda bitiriyorsanız ideal olarak bir süper bilgisayar 10 işlemci ile 1 saykılda bitirebilir.

SCUXİA ZHANG,szhang@msi.umn.edu

Etiketler: , , , , , , , , , , , ,

1 Yorum to “Süper Bilgisayarlar”

  1. Esma

    Eki 11. 2014

    Güzel

    Reply to this comment

Yorum yazın