Önerilen, 2024

Editörün Seçimi

Ile 90 saniyede bir Hadoop veya Spark kümesi vaat ediyor Google 90 saniyede Cloud Dataproc

Run Spark and Hadoop Faster with Cloud Dataproc | Google Cloud Labs

Run Spark and Hadoop Faster with Cloud Dataproc | Google Cloud Labs
Anonim

Büyük verilerden elde edilen bilgiler genellikle hızlı ve kolay değil, ancak Google bunu tümüyle yenisiyle değiştirmeyi hedefliyor. , Hadoop ve Spark için yönetilen hizmet.

Arama devinin Çarşamba günü açık beta sürümüyle başlattığı Cloud Dataproc, şirketlerin hızlı bir şekilde kümeler oluşturmasına, onları kolayca yönetmesine ve devre dışı bırakmasına yardımcı olmak için tasarlanan büyük veri portföyünün yeni bir parçası. İhtiyaç duyulmadığında.

Şirketler, hızla gelişen büyük veri teknolojisinden en iyi şekilde faydalanmakla uğraşıyorlar, diyor Constellation Research'den sorumlu başkan yardımcısı ve ana analist Holger Mueller.

[Ekstra okuma: En iyi TV akışı hizmetler]

“Ortalama işletmenin kurması ve işletmesi çoğu zaman kolay değil” dedi. İki açık kaynak ürününün birleştirilmesi gerektiğinde, "işler daha da karmaşıklaşabilir."

Hadoop ve Spark kümelerini uygulamak ve işletmek için kolay bir yol, işletmeler için önemli bir değer olabilir. Bu arada, Google için Cloud Dataproc daha fazla yük, kullanım ve daha iyi ölçek ekonomisi yaratan müşteriler anlamına geleceğini belirtti. Mueller,

'dan bu yana, Cloud Dataproc'un hem geleneksel, hem de şirket içi ürün ve rakip bulut hizmetlerine göre birçok avantaj sunuyor. Google.

Spark ve Hadoop kümelerini kurum içi veya Hizmet Olarak Altyapı (IaaS) sağlayıcıları oluşturarak 5 ila 30 dakika arasında bir süre alabilirken, Cloud Dataproc kümeleri ortalama 90 saniye veya daha kısa sürüyor. başlamak ve ölçeklemek veya kapatmak için aynı miktarda süre. Bu da, kullanıcıların verileriyle çalışmak için daha fazla zaman harcadıkları anlamına gelebilir.

"Kendi kendine yönetilen dağıtımda, şirket içi veya bulutta yaptığınız zaman, kendi zamanınızda etkili bir şekilde ödeme yaparsınız. Kümeler, "dedi Google Cloud Platformu ürün yönetimi müdürü Greg DeMichillie. "Cloud Dataproc'un yapmanıza izin verdiği şey, bir soru sorduğunuz zaman ve içgörü aldığınız zaman arasındaki süreyi kısaltmaktır."

Fiyatlandırma, her kümedeki saat başına sanal CPU başına 1 senttir ve Cloud Dataproc kümeleri önceden içerebilir hala daha düşük hesaplama fiyatlarına sahip olan ve böylece maliyetleri daha da düşüren, tekrarlanabilen örnekler. Çoğu sağlayıcı, kullanımı en yakın saate yuvarlarken, Cloud Dataproc dakika dakika faturalandırma ve 10 dakikalık minimum faturalandırma süresi kullanır.

Cloud Dataproc ayrıca BigQuery gibi Google Cloud Platform hizmetleriyle entegre entegrasyon sağlar. Bulut Depolama, Bulut Bigtable, Bulut Günlüğü ve Bulut İzleme. Şirketler, örneğin mantıksal veri verilerinin terabaytlarını iş raporları için doğrudan BigQuery'ye ayıklamak, dönüştürmek ve yüklemek için kullanabilirler.

Hizmetler yönetildiği için şirketler, bir yönetici veya özel yazılım yardımı olmadan Spark ve Hadoop kümelerini kullanabilirler. , Google dedi. Bunun yerine, Google Developers Console, Google Cloud SDK veya Cloud Dataproc REST API'sı aracılığıyla kümeler ve Spark veya Hadoop işleriyle etkileşimde bulunabilirler; Bir küme ile bittiğinde, bunu kapatabilir ve gereksiz yere para harcamaktan kaçınabilirler.

Cloud Dataproc'un şu anki uygulaması Spark 1.5 ve Hadoop 2.7.1'e dayanan kümelere sahiptir.

Top