Data Mining

Deskripsi Lomba

Deep learning merupakan suatu algoritma mutakhir data mining yang semakin banyak menarik perhatian baik di kalangan industri maupun akademik dunia dewasa ini. Keunggulan deep learning dibandingkan dengan algoritma konvensional adalah kemampuan untuk melatih jutaan bahkan miliaran parameter pemelajaran yang tersusun secara hierarkis multi lapis. Selain berkat terobosan algoritma, deep learning juga telah dimungkinkan berkat tersedianya Big Data yang diperlukan untuk melatih parameter dalam jumlah raksasa tersebut. Dengan adanya konvergensi antara deep learning dan big data telah terbukti mampu memberikan insight atau performa yang sama bahkan melampaui human level performance.

Para peserta lomba diharapkan mampu melakukan proses Data Mining terhadap Big Data yang tersedia secara publik di web serta sudah terverifikasi validitasnya. Langkah peserta selanjutnya adalah memvisualisasikan hasil proses data mining tersebut sehingga berguna bagi masyarakat luas.

Babak Penyisihan

  1. Pengumpulan makalah Data Mining dengan tema “Deep Learning from Big Data for Big Insight and Big Solution for Indonesia”.
  2. Makalah menyajikan beberapa poin penting sebagai berikut:
    • Judul makalah
    • Latar belakang yang terkait dengan permasalahan seputar “deep learning” dan “big data” untuk solusi bagi masalah yang ada di masyarakat Indonesia.
    • Tujuan dan manfaat yang diperoleh dari proses “data mining”
    • Batasan yang digunakan
    • Metode data mining
    • Desain dan implementasi “data mining”
    • Analisis
    • Kesimpulan
    • Dokumentasi
  3. Data dipastikan bersifat terbuka untuk publik dan boleh digunakan untuk lomba.
  4. Peserta tidak diharuskan menggunakan “Deep Learning” walaupun biasanya “Big Data” seringkali lebih dapat diselesaikan dengan “Deep Learning”.
  5. Peserta boleh tapi tidak diharuskan untuk menggunakan GPU (Graphical Processing Unit) untuk melakukan komputasi algoritmanya.
  6. Peserta boleh menggunakan tools, library, atau framework apa saja.
  7. Solusi dan algoritma yang diusulkan belum pernah digunakan atau dipublikasikan sebelumnya baik untuk lomba maupun publikasi ilmiah.
  8. Jika solusi dan algoritma adalah modifikasi dari apa yang ada sebelumnya, harus dijelaskan modifikasi dan inovasi apa yang yang dilakukan serta menjelaskan sumber asli maupun sumber inspirasi yang dirujuk.

Babak Final

  1. Peserta akan diberikan dataset disertai deskripsi singkat.
  2. Dataset yang diberikan adalah training data yang hanya merupakan 50% dari data keseluruhan. Dengan training data tersebut, peserta akan diberi waktu 5 jam untuk membangun model.
  3. Peserta kemudian akan diberikan 50% data uji dan melakukan pengukuran akurasi menggunakan komputer masing-masing di bawah pengawasan dan dicatat oleh dewan juri.
  4. Peserta harus mendokumentasikan pekerjaan “data mining”-nya dalam bentuk file ppt dan kemudian mempresentasikan di hadapan juri.
  5. Dalam membangun model, peserta diperbolehkan menggunakan alat bantu data mining (tools, library, atau framework)
  6. Walaupun kasus yang diberikan adalah “big data problem”, panitia merancang agar problem masih scalable untuk diselesaikan tanpa perlu menggunakan GPU.

Kriteria Penilaian

Babak Penyisihan

  1. Penilaian utama nya adalah apakah peserta dapat menjadikan Deep Learning dan Big Data bagi solusi permasalahan yang ada di tanah air atau memberi manfaat bagi kepentingan masyarakat.
  2. Laporan yang dikumpulkan tidak menentukan urutan. Laporan adalah syarat mutlak bagi peserta agar dapat membuktikan bahwa peserta mengerjakan penyisihan sendiri. Kegagalan peserta dalam memberikan laporan yang benar akan berakibat terhadap tidak diperhitungkannya peserta tersebut untuk lolos ke final.

Babak Final

  1. Perhitungan skor didasarkan pada tingkat akurasi terhadap data uji yakni 50% data yang tidak digunakan pada saat membangun model dan juga inovasi dan kejelasan dalam presentasi.
  2. Ranking diurutkan berdasarkan total poin di akhir kompetisi.
  3. Apabila ada peserta dengan total poin yang sama maka akan diurutkan berdasarkan waktu terakhir peserta tersebut melakukan submission Flag ke sistem lomba. Apabila masih sama maka akan dilihat dari waktu submission sebelum-sebelumnya.

Kriteria penilaian tiap babak disajikan dalam format tabel berikut:

Babak Penyisihan (Bobot 60)

  1. Originalitas (Bobot 15)
  2. Kebaruan (Bobot 15)
  3. Manfaat (Bobot 15)
  4. Clarity dalam tulisan (Bobot 15)

Babak Final (Bobot 40)

  1. Skor akurasi (Bobot 20)
  2. Inovasi (Bobot 10)
  3. Clarity dalam menjelaskan (Bobot 10)

Selengkapnya Jadwal Gemastik 10

Selengkapnya Buku Panduan Gemastik 10 Terkini