Midterm Test ADS Flashcards

1
Q

Apa itu data science?

Soal Quiz

A

Ilmu yang mempelajari data terutama yang sifatnya kuantitatif. Dapat juga berarti Proses penggalian data atau Proses untuk memproduksi pengetahuan data (data insight)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Apa itu Data Insight?

Soal Quiz

A

Sebuah simpulan yang dapat memberikan rekomendasi atau prediksi untuk kebutuhan tertentu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Apa peran seorang Data Scientist?

Soal Quiz

A
  • Melakukan Pengolahan data sehingga menghasilkan pengetahuan
  • Melakukan Mining Data dengan mekestraknya hingga menemukan data akurat
  • Mengidentifikasi permasalahan, Mengumpulkan data dari berbagai sumber, mengatur informasi, dan menerjemahkan hasi menjadi solusi
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Berapa tahap yang ada dalam proses data science untuk menghasilkan produk data yang benar?

Soal Quiz

A

3 yakni desain data, pengumpulan data, dan analisis data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Apa yang dimaksud dengan transformasi digital dalam konteks data science?

Soal Quiz

A

Pergerakan yang mengisyaratkan betapa bernilainya data bagi sebuah langkah strategis bisnis (Data is a new currency

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Cabang ilmu kecerdasan buatan (Artificial Intelligence) yang mempelajari bagaimana dapat memberikan kemampuan belajar pada sebuah mesin dengan menggunakan algoritma tertentu merupakan pengertian dari

A

Machine Learning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Traditional Software merupakan cabang ilmu yang dihasilkan dari irisan cabang ilmu …

A

Komputer dengan Subject Matter Expertise (SME)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Apa yang dimaksud dengan Subject Matter Expertise (SME)?

A

Pengetahuan yang digunakan untuk mengembangkan sistem yg dapat membantu proses bisnis pada sebuah instansi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Cabang ilmu yg diperoleh dari irisan ilmu matematika dan statistika dengan SME adalah

A

Traditional Research

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Sebutkan Pengaplikasian data science dalam industri

A
  • Analisis foto medis
  • Deteksi penipuan di sektor keuangan
  • Penetapan harga yg dinamis
  • Merekrut bintang muda potensial
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Apa itu data mining?

A

proses memilah-milah kumpulan data besar untuk mengidentifikasi pola dan hubungan yg dapat membantu memecahkan masalah bisnis melalui analisis data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Apa tujuan utama machine learning?

A

Untuk membuat model yang dapat membuat prediksi atau klasifikasi yang akurat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Memahami lebih jauh data yg diamati dan mengetahui karakteristik dari data yg dimaksud merupakan fungsi data mining yakni…

A

Descriptive

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Menemukan pola tertentu dari suatu data yg digunakan untuk memprediksi variabel lain yg blm diketahui nilai atau jenisnya merupakan fungsi data mining yakni?

A

Predictive

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

CRISP-DM merupakan singkatan dari

A

Cross-Industry Standard Process for Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Sebutkan tahapan CRISP-DM!

A
  1. Business Understanding
  2. Data Understanding
  3. Data Preparation
  4. Modeling
  5. Evaluation
  6. Deployment
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Apa yang dimaksud dengan mean?

Soal Quiz

A

Nilai yang didapatkan dari penjumlahan seluruh data yang dibagi dengan jumlah data tersebut atau
rata-rata

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Apa yang dimaksud dengan median?

Soal Quiz

A

Nilai tengah dalam suatu rangkaian data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Apa yang dimaksud dengan range?

Soal Quiz

A

Selisih antara nilai maksimum dan minimum dalam kumpulan data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Apa yang dimaksud dengan mode?

Soal Quiz

A

Nilai yang paling sering muncul dalam kumpulan data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Apa yang dimaksud dengan variance?

Soal Quiz

A

Rata-rata dari kuadrat selisih setiap nilai data dan mean

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Apa yg dimaksud Standard Deviation?

A

Simpangan Baku atau akar kuadrat dari varians

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Statistika adalah…

A

Ilmu yg mempelajari data dan peluang

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Statistik Inferensial digunakan untuk…

A

membuat kesimpulan atau prediksi dari data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Apa kegunaan dari Distribusi Probabilitas?
Untuk **menghitung probabilitas peluang** atau teknik pengurangan dimensi, over and under sampling, hingga teknik bayesian statistik
26
Konsep yg menjelaskan penggunaan probabilitas untuk memodelkan proses pengambilan sample dan mengontrol situasi tidak pasti sebelum proses pengumpulan data dilakukan merupakan pengertian dari?
Konsep Bayesian
27
Distribusi yang digunakan untuk menggambarkan **variabel acak** yg **berkelanjutan** adalah
Distribusi Probabilitas kumulatif atau normal
28
Distribusi probabilitas binomial atau diskrit adalah
distribusi yang digunakan untuk menggambarkan variabel acak yg diskrit
29
Metode matematika yg memungkinkan ilmuwan data untuk memprediksi hasil kontinu (y) berdasarkan nilai satu atau lebih variabel prediktor (x) adalah
Regresi
30
Apa perbedaan regresi linier dan non-linier?
**Regresi linier** mengacu pada **satu variabel **independet untuk membuat prediksi sedangkan** Regresi non-linier** mengacu pada **dua atau lebih variabe**l independent
31
Fungsi Matriks dalam data science adalah
* Penyimpanan data * Operasi Matriks * Transformasi data * Analisis data * Evaluasi model
32
Apa itu dataframe?
struktur data 2 dimensi yg berbentuk tubular, terdiri dari baris dan kolom
33
Apa perbedaan Matriks dan Dataframe?
Setiap elemen pada matriks memiliki tipe data yg sama biasanya numerik, sedangkan setiap kolom pada dataframe dapat memiliki tipe data yg berbeda seperti angka, string, dll.
34
Bagaimana cara mengubah tipe data pada dataframe di Python? ## Footnote Soal Quiz
Menggunakan fungsi astype()
35
Bagaimana cara merubah nama kolom pada dataframe di Python? ## Footnote Soal Quiz
Menggunakan metode rename()
36
Bagaimana cara menghapus baris pada dataframe di Python? ## Footnote Soal Quiz
Menggunakan fungsi drop()
37
Bagaimana cara melakukan manipulasi data seperti mengurutkan, memilih, dan menghapus nilai-nilai duplikat pada dataframe di Python? ## Footnote Soal Quiz
Menggunakan atribut columns
38
Bagaimana cara mentransfer nilai data ke dataframe di Python? ## Footnote Soal Quiz
Menggunakan fungsi atau mapping
39
Bagaimana cara mengganti nilai yg hilang pada dataframe di python?
Menggunakan fungsi fillna()
40
Bagaimana cara mengelompokkan data kedalam interval tertentu pada dataframe di python?
Menggunakan metode cut()
41
Apa pengertian hipotesis menurut KBBI
sesuatu yg dianggap benar untuk alasan atau pengutaraan pendapat meskipun kebenarannya masih harus dibuktikan
42
Pengujian hipotesis dalam penelitian digunakan dalam situasi apa saja?
* Menguji kebenaran teori * Memberikan gagasan baru untuk mengembangkan suatu teori * Memperluas pengetahuan penelitian mengenai suatu gejala yg sedang dipelajari * menguji dugaan penelitian * menyusun problem statement
43
Representasi data, pemilihan dan pelatihan model, evaluasi model, pemahaman data, mengurangi kesalahan, dan menciptakan konsistensi merupakan fungsi dari
Model
44
Optimasi dalam data science adalah
Proses mencari nilai terbaik dari fungsi tujuan dalam suatu himpunan yg diizinkan
45
Sebutkan penerapan optimasi dalam data science!
Pembelajaran mesin, pemilihan model, penyusunan parameter, pengurangan dimensi, dan jaringan saraf tiruan
46
Bagaimana deep learning digunakan dalam pembelajaran mesin? ## Footnote Soal Quiz
Digunakan untuk menyesuaikan model dengan data pelatihan.
47
Apa yang dimaksud dengan Volume dalam konteks Big Data? ## Footnote Soal Quiz
Merujuk pada jumlah data yang sangat besar
48
Apa yang diatur dalam Pasal 27 Ayat (3) UU ITE? ## Footnote Soal Quiz
Penyebaran informasi yang melanggar kesusilaan
49
Berapakah hukuman maksimal yang dapat diberikan kepada seseorang yang menyebarkan informasi elektronik bermuatan asusila menurut Pasal 45 Ayat (1)? ## Footnote Soal Quiz
Denda Rp 1 miliar dan penjara enam tahun
50
Apa yang diatur dalam Pasal 45 Ayat (2) UU ITE? ## Footnote Soal Quiz
Penyebaran berita bohong atau hoax kepada masyarakat
51
Deep learning disebut juga dengan
Deep neural learning atau deep network learning
52
Algoritma yg digunakan untuk meniru cara kerja otak manusia adalah
Algoritma jaringan syaraf atau artificial neural network dan turuannya
53
Apa pengertian dari big data?
Kumpulan data yg sangat besar, kompleks dan terus bertambah setiap waktu
54
Ada berapa karakteristik utama big data?
5V, yakni Volume, Velocity (kecepatan), Variety (variasi), Value (nilai), dan Veracity (keakuratan)
55
Jenis big data dimana data terstruktur dengan bak dan terdefinisikan adalah
Data terstruktur (Structured data)
56
Apa yg dimaksud dengan semi structured data?
data yg terstruktur namun tidak lengkap dan tidak memenuhi syarat data yg terstruktur
57
Apa jenis big data yg sulit ditangani, dipahami, dan dianalisis?
Unstructured data
58
Apa contoh unstructured data?
Data komentar, twit di twitter, postingan dan like
59
Sebutkan teknologi penyimpanan yg umum digunakan untuk big data!
Hadoop, cloud, dan NoSQL
60
Apa yg dimaksud etika akuntabilitas dalam data science
perusahaan bertanggung jawab penuh atas semua kerugian yg terjadi atas data yg dikumpulkan
61
Apas aja etika dalam data science?
Privasi, bias, transparansi, akuntabilitas, kenetralan, keadilan, kejujuran
62
Salah satu etika dalam data science adalah kejujuran yg berarti bebas dari DF2P dalam publikasi. Apa itu DF2P?
Duplikasi, Fabrikasi, Falsifikasi, Plagiarisme
63
Apa uu yg mengatur tentang pemberian hak kepada subjek data pribadi untuk mengakhiri pemrosesan, menghapus dan/atau memusnahkan data pribadi tentang dirinya sesuai dengan ketentuan peraturan perundang-undangan?
UU No.27 Tahun 2022 Pasal 8
64
UU No.27 Tahun 2022 Pasal 20 mengatur tentang
Setiap orang wajib memiliki dasar pemrosesan data pribadi
65
Apa UU yg mengatur tentang pencemaran nama baik melalui media elektronik?
Pasal 27 ayat (4) UU ITE
66
Sebutkan protokol AI
Pengidetifikasian konten AI, Kerangka kerja tata kelola, pengaturan privasi, pengaturan keamanan, pengaturan kepatuhan, pengaturan transparansi dan akuntabilitas
67
Apa saja cakupan kerangka kerja tata kelola pada protokol AI
Standar teknis, pedoman etus, dan prosedur penanganan data
68
* Perlindungan HAM dan martabar * Kerangka kerja aksi kebijakan * Proporsionalitas dan tidak menyakiti * keamanan dan keselamatan * keadilan dan non-diskriminasi * keberlanjutan * hak privasi dan perlindungan data * pengawasan manusia dan penentuan * Transparansi dan penjelasan Merupakan etika kecerdasan AI menurut
UNESCO
69
Sebutkan 3 laws of robotics
* tidak boleh melukai manusia atau membiarkan manusia dalam bahaya * mematuhi perintah manusia selama tidak bertentangan dengan hukum pertama * melindungi eksistensinya sendiri selama tidak bertentangan dengan hukup pertama atau kedua
70
Apa bahasa pemrograman yg sangat popular dikalangan data scientist
Python
71
Apa bahasa pemrograman yg khusus dirancang untuk statistik dan visualisasi data
R
72
Bahasa pemrograman Julia adalah
bahasa baru yg dirancang khusus untuk komputasi numerik dan data science
73
Apa kelebihan dari Python?
* sintaks bersih dan mudah dibaca * library luas * komunitas besar * fleksibilitas
74
Apa library python yg digunakan untuk manipulasi dataframe
pandas
75
Apa library python yg digunakan untuk manipulasi array
NumPy
76
Data primer adalah
Data yg dikumpulkan langsung oleh analis utnutk tujuan spesifik proyek
77
Kapan biasanya dilakukan pengumpulan data primer?
Ketika data yg ada tidak memadai, tidak relevan, atau tidak tersedia untuk kebutuhan penelitian khusus tersebut
78
Apa saja metode pengumpulan data primer?
survei dan kuisioner, wawancara, dan observasi
79
Data yg sudah dikumpulkan dan diproses oleh pihak lain dan tidak dikhususkan untuk analisis saat ini disebut
Data sekunder
80
Apa saja keuntungan dari data sekunder?
* Hemat waktu dan biaya * Akses ke data set yg luas * Studi longitudinal (jangka panjang)
81
Apa saja keterbatasan data sekunder?
* relevansi dan ketepatan * Kualitas dan konsistensi * keterbatasan akses
82
Contoh web untuk mencari data set public adalah
Kaggle, UCI Machine learning repository, dan Satu Data Indonesia
83
Langkah CRISP-DM untuk menentukan tujuan bisnis, menilai situasi saat ini, menetapkan tujuan penambangan data dan mengembangkan rencana proyek adalah
Business Understanding
84
Apa saja tahapan yg digunakan pada tahap Data Preparation
* Check duplikasi data * Perhitungan nilai * Pengurangan data * Menambahkan kolom data baru * Split data * Pembersihan data
85
Untuk memahami tipe data dan informasi tentang data pada python gunakan
perintah .info()
86
.nunique() pada python digunakan untuk
memeriksa duplikasi data
87
isnull() pada python digunakan untuk
mengetahui baris yg tidak memiliki nilai
88
Perintah apa yg digunakan untuk mendapatkan jumlah record yg hilang di setiap kolom pda python
data.isnull().sum()
89
Suatu pendekatan yg digunakan dalam analisis data untuk mengoptimalkan pengetahuan ke dalam datasetm menemukan struktur dasar dataset, mengekstrak variabel penting, mendeteksi outlier dan anomaly, menguji asumsi yg menjadi dasar dataset, mengembangkan model pasimonius, dan menentukan pengaturan faktor yg normal disebut
Analisis Data Eksplorasi
90
Analisis Data Eksplorasi dikembangkan oleh ahli statistik bernama
John Tukey
91
Apa output ringkasan statistik untuk data object?
Count, unique, top, freq
92
count, mean, standard devation, min, max, 25 percentile,50 percentile, dan 75 percentile merupakan output ringkasan statistik untuk data
Numerik
93
Apa perintah yg digunakan untuk menghitung ringkasan statistik pada python?
.describe()
94
Perintah .describe(include='all').T digunakan untuk...
Menampilkan semua data termasuk object pada ringkasan statistik
95
Untuk mengetahui tipe dari masing masing variabel pada ringkasan statistik digunakan perintah
.dtypes
96
Library Matplotlib dibuat oleh
John D.Hunter
97
Library python untuk menggambar plot 2D dengan kualitas tinggi adalah
Matplotlib
98
library python yg ditambahkan agar tampilan chart lebih modern adalah
Seaborn
99
Library seaborn pertama kali diperkenalkan oleh
Michael Askom
100
Variabel Kategorikal pada ADE divisualisasikan dengan
Count plot, barchart, dan pie plot
101
Variabel numerik pada ADE divisualisasikan dengan
Histogram, box plot, dan Density plot
102
Kapan sejarah data science dimulai?
1962
103
Tahun 1962 John Tukey menulis "The Future of Data Analysis" yg menggambarkan tentang....
Pergeseran dalam dunia statistik
104
Kapan dan oleh siapa Buku "The Concise survey of Computer Methods" diterbitkan?
1974, oleh Peter Naur
105
Peter Naur mendefinisikan data science sebagai....
ilmu yg mengelola data
106
Apa yg terjadi pada tahun 1977 dalam sejarah data science?
Dibentuknya IASC (International Association for Statistical Computing)
107
Menghubungkan teknologi komputer modern, metodologi statistik tradisional, serta pengetahuan untuk menghasilkan informasi dan pengetahuan berbasis data merupakan misi dari
IASC
108
Workshop Knowledge Discovery in Database (KDD) pertama kali diselenggarakan pada tahun 1989 dan dipimpin oleh
Gregory Piatetsky-Shapiro
109
Apa yg diserukan oleh Prof.C.F.Jeff Wu dalam kuliah di Univ. Michigan pada tahun 1997?
Menyerukan agar statistik diganti nama menjadi data science dan ahli statistik diganti nama menjadi data scientist
110
Siapa yg mengatakan perlunya alat baru untuk menangani jumlah data yg sangat besar pada tahun 1999
Jacob Zahavi
111
Apa yg terjadi pada tahun 2001 dalam sejarah data science?
terciptanya software-as-a-service (SAAS) untuk pertama kalinya
112
Kapan Hadoop 0.1.0 dirilis?
tahun 2006
113
Pada tahun 2010 Drew Conway membuat The Data Science Venn Diagram yg mencakup keterampilan
meretas, pengetahuan matematika dan statistik, keahlian substantif
114
Dafta pekerjaan untuk data scientist meningkat 15.000 persen pada tahun
2011
115
Apa yg terjadi pada tahun 2015 dalam sejaeah data science
* teknik deep learning digunakan untuk google voice * meningkatnya proyek perangkat lunak di google yg menggunakan AI sebanyak lebih dari 2700 proyek