IBM Storage Ceph

Merhabalar, Ceph ile ilgili 2020 yılında yazdığım yazıları incelediğimde ne kadar da detaylı anlatmışım dedim kendi kendime.

https://asiyeyigit.com/red-hat-ceph-storage/  * 1 Mart 2020 – Pazar

https://asiyeyigit.com/red-hat-ceph-storage-bolum-2/ * 29 Mart 2020 Pazar

Ceph’in geçmişten bugüne olan yolculuğuna şöyle bir bakalım mı?

  • 2004: Sage Weil, Kaliforniya Üniversitesi, Santa Cruz’da doktora tezi kapsamında Ceph’i geliştirmeye başladı.
  • 2012: Weil, Ceph’in ticari desteğini sağlamak ve kurumsal pazara açmak için Inktank şirketini kurdu.
  • 2014: Red Hat, Ceph’in artan popülaritesini fark ederek Inktank’i satın aldı ve Red Hat Ceph Storage adı altında kurumsal destek sağlamaya başladı.
  • 2018: Ceph topluluğunu daha iyi desteklemek amacıyla Linux Vakfı tarafından Ceph Vakfı kuruldu.
  • 2019: IBM, Red Hat’i 34 milyar dolarlık bir satın alma anlaşmasıyla bünyesine kattı. Bu süreçte Ceph’in açık kaynak kimliği korunmaya devam etti.
  • 2022: IBM ve Red Hat, Ceph geliştirme ekiplerinin IBM bünyesine taşınacağını duyurdu. Bu geçiş, IBM’in Ceph Vakfı’nın ana sponsoru olmasını sağladı ve Ceph’in uzun vadeli destek almasını garantiledi.
  • 2023: Ceph’in “Reef” kod adlı 18.2.0 sürümü yayımlandı. Bu sürümle birlikte IBM Storage Ceph 7.0 piyasaya sürüldü.

Ceph’in açık kaynak yapısı, topluluk desteğiyle güçlenmeye devam ederken, IBM’in katkılarıyla kurumsal pazara daha güçlü bir şekilde entegre edildi. IBM, Ceph’in açık kaynak topluluğuyla olan bağlarını sürdürerek, hem topluluk geliştirmelerini hem de kurumsal çözümleri destekleyen hibrit bir yapı oluşturdu.

IBM’in Ceph üzerindeki etkisi, sadece ticari çözümleri güçlendirmekle sınırlı değildir. IBM, Ceph’in açık kaynak topluluğunu desteklemeye devam etmektedir:

  • Upstream First Politikası: IBM, Ceph için yaptığı geliştirmeleri önce topluluk sürümüne (upstream) eklemekte, daha sonra kurumsal sürümlere dahil etmektedir.
  • Ceph Vakfı ile İşbirliği: IBM, Ceph’in uzun vadeli açık kaynak olarak devam etmesini sağlamak adına Ceph Vakfı’nın ana sponsoru olmuştur.
  • Red Hat Ceph Storage vs IBM Storage Ceph: Red Hat Ceph Storage, Red Hat’in OpenStack ve Kubernetes için optimize ettiği sürümken, IBM Storage Ceph daha geniş bir kurumsal çözüme dönüşmüştür.

Bu stratejiler, IBM’in Ceph’i yalnızca bir ticari ürün olarak değil, açık kaynak bir proje olarak da desteklediğini göstermektedir.

Gelin şimdi IBM Storage Ceph’in detaylarına birlikte bakalım.

IBM Storage Ceph, nesne, blok ve dosya depolamayı tek bir yazılım tanımlı depolama platformunda birleştiren yüksek ölçeklenebilir bir çözümdür. Modern veri iş yükleri için tasarlanan Ceph, AI, büyük veri analitiği ve bulut-native uygulamaların taleplerini karşılamak üzere geliştirilmiştir.

Bu makalede IBM Storage Ceph’in mimarisini, veri dağıtım mekanizmalarını, 7.0 sürümündeki yeni özellikleri ve en iyi kullanım senaryolarını detaylandıracağız.

IBM Storage Ceph Genel Bakış

IBM Storage Ceph, açık kaynaklı Ceph projesinin IBM tarafından desteklenen bir dağıtımıdır. Çekirdeğinde Reliable Autonomic Distributed Object Store (RADOS) bulunur. IBM Storage Ceph, aşağıdaki temel depolama çözümlerini sunar:

  • Object Storage: S3 ve Swift API uyumlu RADOS Gateway (RGW) aracılığıyla erişim sağlar.
  • Block Storage: RADOS Block Device (RBD) kullanarak sanal blok cihazları sunar.
  • File Storage: Ceph File System (CephFS) ile POSIX uyumlu paylaşılan dosya sistemleri sağlar.

Bu yapı, tek bir platformda farklı depolama ihtiyaçlarını karşılamak için tasarlanmıştır ve büyük ölçekli sistemlerde veri yönetimini kolaylaştırır.

Mimari ve Bileşenler

a. RADOS Bileşenleri

IBM Storage Ceph, aşağıdaki temel bileşenlerden oluşur:

  • Monitors (MONs): Cluster state, map güncellemeleri ve quorum yönetimini sağlar.
  • Object Storage Daemons (OSDs): Verinin saklanması, replication, erasure coding ve recovery süreçlerini yürütür.
  • Managers (MGRs): Monitoring, load balancing ve yönetimsel görevleri yürütür.
  • Metadata Servers (MDSs): CephFS için metadata yönetimi sunar.

Bu bileşenler, IBM Storage Ceph’in yüksek erişilebilirlik ve self-healing mimarisinin temel taşlarını oluşturur.

b. Veri Dağıtımı ve CRUSH Algoritması

Ceph, veriyi cluster içinde Controlled Replication Under Scalable Hashing (CRUSH) algoritmasıyla dağıtır. CRUSH, merkezi metadata sunucularına olan ihtiyacı ortadan kaldırarak büyük ölçekli dağıtılmış sistemlerde yük dengesini sağlar. Avantajları şunlardır:

  • Verinin cluster içindeki tüm OSD’lere dengeli şekilde dağıtılmasını sağlar.
  • Cluster genişlediğinde veya bir düğüm (node) başarısız olduğunda otomatik rebalancing yapar.
  • Metadata ihtiyacını en aza indirerek düşük gecikmeli erişim sağlar.

IBM Storage Ceph 7.0’daki Yenilikler

IBM Storage Ceph 7.0, çeşitli performans, güvenlik ve ölçeklenebilirlik iyileştirmeleri sunar:

a. Replicated Storage

IBM Storage Ceph, veriyi replication veya erasure coding (EC) ile koruma seçenekleri sunar. Replication, verinin birden fazla kopyasını farklı OSD’lerde saklayarak hızlı erişim ve yüksek güvenilirlik sağlar. Varsayılan olarak 3 kopya oluşturulur ancak konfigüre edilebilir.

b. WORM Uyumluluğu

Write Once, Read Many (WORM) uyumluluğu sayesinde SEC 17a-4(f), FINRA 4511(c) gibi regülasyonlara uygun immutable storage sunar.

c. Multi-Site Replication with Bucket Granularity

Bu yeni özellik, buckets bazında replikasyon yaparak daha fazla esneklik sağlar. Önceki sürümlerde sadece full zone replication mümkündü, ancak artık belirli bucket’ların farklı cluster’lara kopyalanması sağlanabilir.

d. Object Archive Zone

Tüm nesne versiyonlarının immutable olarak saklanmasını sağlayan Object Archive Zone, fidye yazılımlarına ve veri silinmesine karşı koruma sağlar.

e. Policy-Based Data Archival

IBM Storage Ceph, AWS ve Azure gibi public cloud ortamlarına otomatik veri arşivleme ve geçiş desteği sunar.

f. NVMe-over-Fabric (NVMe-oF) Desteği

NVMe-over-Fabric (NVMe-oF) desteği ile Linux olmayan istemcilerin de Ceph’in blok depolama hizmetlerinden faydalanmasını sağlar.

En İyi Kullanım Senaryoları ve Best Practices

IBM Storage Ceph’in optimum performans ve güvenilirlik sunması için aşağıdaki en iyi uygulamalar önerilir:

a. Donanım ve Cluster Yapılandırma

  • SSD/NVMe disklerini metadata ve journal için kullanarak IOPS performansını artırın.
  • Minimum 3 MON node deploy ederek quorum mekanizmasını sağlayın.
  • OSD’leri farklı sunuculara yayarak load balancing’i optimize edin.

b. Veri Koruma Stratejileri

  • Replication ile düşük gecikmeli, hızlı veri erişimi sağlayın.
  • Erasure Coding (EC2+2, EC4+2) kullanarak daha verimli depolama sağlayın.

c. Monitoring ve Yönetim

  • Ceph Dashboard ve Prometheus ile cluster sağlığını gerçek zamanlı takip edin.
  • ceph status, ceph df komutlarını düzenli olarak çalıştırarak cluster performansını izleyin.
  • Otomatik yedekleme ve disaster recovery senaryolarını test edin.

IBM Storage Ceph, yüksek ölçeklenebilirliği, dayanıklılığı ve performansı ile modern veri merkezi ihtiyaçlarını karşılayan bir depolama çözümüdür. IBM’in Ceph’e olan yatırımları, bu platformun açık kaynak ruhunu koruyarak gelişmesini ve aynı zamanda kurumsal pazarda güçlü bir konum edinmesini sağlamaktadır.

Gelecekte, IBM’in Ceph’i daha fazla AI, makine öğrenimi ve kurumsal büyük veri iş yükleri için optimize etmesi beklenmektedir. Ceph’in NVMe-oF, S3 Select ve multi-site replication gibi gelişmiş özelliklerinin, veri depolama ve yönetim alanında sektördeki en güçlü çözümlerden biri olarak konumlanmasını sağlayacağını düşünüyorum.

Sarav Asiye Yiğit – 21 Şubat 2025

Kaynakça:

IBM Storage Ceph Concepts and Architecture Guide (IBM Redbooks)

https://ceph.io/en/

https://en.wikipedia.org/wiki/Ceph_%28software%29