Data Raya ialah bidang yang mengendalikan cara untuk menganalisis, mengekstrak maklumat secara sistematik daripada set data yang bersaiz besar atau kompleks untuk mengatasi masalah yang dihadapi oleh perisian pemprosesan data tradisional. Data dengan banyak medan (column) menawarkan kuasa statistik yang lebih besar, manakala data dengan kerumitan yang lebih tinggi (lebih banyak atribut atau medan) boleh membawa kepada kadar penemuan palsu yang lebih tinggi. Cabaran analisis data besar adalah seperti menangkap data, mengurus storan data, menganalisis data, membuat carian atau pertanyaan, melaksanakan perkongsian data, membuat pemindahan data, membangun visualisasi, pengemaskinian data sumber, membina privasi maklumat dan sumber data, dan sebagainya. Data raya pada asalnya dikaitkan dengan tiga konsep utama iaitu: saiz (volume), kepelbagaian (variety), dan halaju (velocity). Analisis data raya memberikan cabaran dalam persampelan, dan selalunya termasuk data dengan saiz yang melebihi kapasiti perisian tradisional untuk diproses dalam masa dan nilai yang boleh diterima.
Konsep data raya telah wujud sejak lama dahulu, dan kebanyakan organisasi kini memahami bahawa jika mereka menangkap semua data yang disalurkan ke dalam perniagaan mereka, mereka boleh menggunakan analisis dan mendapat nilai yang signifikan daripadanya. Tetapi pada tahun 1950-an, beberapa dekad sebelum wujudnya istilah "data raya" (big data), organisasi perniagaan menggunakan analitik asas (pada asasnya nombor dalam hamparan (spreadsheet) yang diperiksa secara manual) untuk mendedahkan cerapan dan arah aliran.
Kaedah baharu yang dibawa oleh analitik data raya adalah kelajuan dan kecekapan dalam pemprosessan. Walaupun beberapa tahun yang lalu pengguna akan mengumpulkan maklumat, menjalankan analisis dan mencungkil maklumat yang boleh digunakan untuk membuat keputusan masa depan. Hari ini pengguna boleh mengenal pasti cerapan untuk membuat keputusan segera. Keupayaan untuk bekerja lebih pantas, dan kekal tangkas adalah dengan memberikan pengguna kelebihan daya saing yang tidak mereka miliki sebelum ini. Hal ini boleh dilakukan dengan menggunakan teknologi data raya.
Dengan berlakunya ledakan data, projek inovasi sumber terbuka seperti pangkalan data Hadoop, Spark dan NoSQL telah dicipta untuk membuat penyimpanan dan pemprosesan data besar. Bidang ini terus berkembang apabila jurutera data mencari cara untuk menyepadukan sejumlah besar maklumat kompleks yang dicipta oleh penderia (sensor), rangkaian, transaksi, peranti pintar, penggunaan web dan banyak lagi. Malah sekarang, kaedah analitik data raya sedang digunakan dengan teknologi baru seperti pembelajaran mesin (machine learning), internet benda (IoT), dan sebagainya untuk menemui dan menskala cerapan yang lebih kompleks.
Analitik data raya membantu organisasi memanfaatkan data mereka dan menggunakannya untuk mengenal pasti peluang baharu. Seterusnya membawa kepada langkah perniagaan yang lebih bijak, operasi yang lebih cekap, keuntungan yang lebih tinggi dan pelanggan yang lebih gembira dan taat. Mengikut kajian Pengarah Penyelidikan IIA Tom Davenport, beliau telah menemu bual lebih daripada 50 ahli perniagaan untuk memahami cara mereka menggunakan data raya. Dia mendapati ahli perniagaan ini mendapat nilai penggunaan data raya melalui pengurangan kos, membuat keputusan yang lebih baik dan pantas, dan mewujudkan produk dan perkhidmatan baharu.
ahlulwulus@Nov2013
No comments:
Post a Comment