Data Warehouse & Data Science Hadoop merupakan software untuk mengelola Big Data, Hadoop juga adalah software yang menghubungkan banyak komputer untuk dapat bekerja sama dan saling terhubung untuk menyimpan dan mengelola data dalam satu kesatuan. Secara umum, Ada beberapa komponen Hadoop yaitu, storage, processing dan package manager, SQL 'Hive', Scripting, In Memory Processing, Management dan Data Movement. Core Hadoop, Data Mining, Database NoSQL merupakan software pendukung Hadoop. Penggunaan Hadoop sebaiknya ketika data yang diolah berukuran sangat besar, diambil dari berbagai sumber dan dalam berbagai bentuk (big data), untuk analisa yang tidak diperlukan dalam waktu dekat penggunaan Hadoop lebih cocok, karena penyimpanan Hadoop cocok untuk waktu yang lama. Data Warehouse serta DataScience sangatlah mirip, keduanya digunakan untuk menyimpan data dengan jumlah yang besar yang digunakan untuk menjawab persoalan bisnis. ...
Posts
Showing posts from December, 2022