Statistika adalah
ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis,
menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenaan dengan
data. Istilah 'statistika' (bahasa Inggris: statistics)
berbeda dengan 'statistik' (statistic). Statistika merupakan ilmu yang berkenaan dengan
data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma
statistika pada suatu data. Dari kumpulan data, statistika dapat digunakan
untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistika deskriptif.
Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas.
Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas. Kata
statistik sendiri berasal dari bahasa Latin, status, yang artinya
negara. Namun secara praktis, kata tersebut digunakan untuk menyatakan hal-hal
yang berhubungan dengan ketatanegaraan. Pada perkembangannya, statistik kemudian
digunakan untuk mengatakan tentang pengumpulan dan penyajian
keterangan-keterangan yang dibutuhkan oleh negara serta berguna bagi negara.
Semua
sumber kesalahan sistematik yang telah dibahas sampai saat ini berkaitan
langsung dengan operasi pengamatan. Namun bagaimanapun, kesalahan sitematik
juga dapat disebabkan oleh penyederhanaan model geometri atau matematika yang
dipilih untuk mewakili daerah survey. Semisal model segitiga digunakan untuk
menghubungkan tiga stasiun yang terpisah beberapa kilometer daripada
menggunakan model segitiga bola, maka kelebihan jarak yang terjadi akan muncul
sebagai kesalahan sistematik.
Pada dasarnya, statistik merupakan suatu kerangka teori yang
juga bagian dari metode yang telah dikembangkan untuk melakukan pengumpulan
data, analisis, dan keputusan atas suatu persoalan.
Akan tetapi, pergeseran makna pun terjadi pada statistik.
Dewasa ini, statistik diartikan bukan pada soal ketatanegaraan, melainkan
diartikan sebagai representasi suatu keadaan yang umumnya ditekankan dengan
angka-angka atau bilangan.
Sebagai contoh, statistik kelahiran dan kematian yaitu
data-data yang ditunjukkan dengan angka-angka tertentu sebagai representasi
jumlah kelahiran dan kematian. Tidak hanya itu, statistik juga dapat digunakan
untuk menyatakan ukuran, rata-rata, nilai penyimpangan, dan angka indeks.
Dengan kata lain, statistik memberikan informasi mengenai
suatu persoalan yang telah diteliti sebelumnya dengan menggunakan data
kuantitatif. Data kuantitatif sendiri adalah fakta yang dapat diwujudkan dengan
angka-angka. Data kuantitatif tersebut menunjukkan jumlah item tertentu dari
suatu kelompok yang akan diketahui karakteristiknya.
Data tersebut dikumpulkan, diolah, dianalisis, dan
disimpulkan. Untuk mendapatkan hasil data kuantitatif yang akurat diperlukan
ilmu statistik, metode statistik, dan analisis statistik.
Dalam ilmu statistik dikenal adanya tugas statistik, yakni
statistik deskriptif dan statistik induktif. Statistik deskriptif adalah
statistik yang memunyai tugas untuk mengumpulkan, mengolah, dan menganalisis data
serta menyajikannya dalam bentuk yang baik.
Sementara itu, statistik induktif adalah statistik yang
memunyai tugas mengambil simpulan dan membuat keputusan beralasan sehubungan
dengan ketidakpastian di masa depan, berdasarkan analisis yang telah dilakukan.
Statistik induktif sering juga disebut statistik inferensial.
Langkah-langkah dan Metode Statistik
Dalam mendapatkan data statistik yang akurat dan baik,
diperlukan adanya metode statistik, yakni metode analisis data kuantitatif
dengan enam langkah berikut ini :
1.
Pembatasan persoalan
2.
Pengumpulan data yang relevan
3.
Penyelidikan
4.
Pengklasifikasian
5.
Penyajian
6.
Analisis
Langkah pertama dalam pemikiran yang rasional statistik
adalah pembatasan persoalan yang benar. Dalam pembatasan persoalan ini, bukan
hanya definisi persoalan saja yang harus dihadirkan, tapi juga persoalan
tersebut harus dibatasi sehingga penggunaan metode kuantitatif mendapat
kemungkinan untuk mencari jawaban dari persoalan tersebut.
Langkah selanjutnya dalam metode statistik ini adalah
pengumpulan data yang relevan. Jika hendak mengumpulkan data yang relevan,
harus ditentukan pula jenis data yang hendak dikumpulkan. Dengan begitu, proses
ini akan berlangsung dengan lancar.
Penyelidikan adalah langkah ketiga yang harus dilakukan
dalam metode statistik. Setelah persoalan tertentu dipelajari dan dibatasi,
informasi yang tersedia telah dikumpulkan, kemudian diadakan penyeleksian data
karena tidak semua data yang telah dikumpulkan diperlukan dalam penelitian
tersebut. Data yang diperlukan hanyalah data yang berperan pada saat
pengambilan simpulan dan keputusan tentang persoalan tersebut. Di luar hal itu,
data-data lain dianggap tidak diperlukan.
Langkah pada metode statistik selanjutnya adalah
pengklasifikasian, yakni proses untuk memisahkan data atas kelompok-kelompok
dengan dasar yang sama. Dengan kata lain, bagian-bagian pada suatu kelompok
harus memunyai sifat-sifat umum yang sama yang dapat dibedakan dengan
bagian-bagian yang dikumpulkan pada kelompok lain.
Setelah keempat langkah tersebut dilakukan, barulah data
statistik tersebut disajikan, baik dalam bentuk tabel maupun diagram. Terakhir,
informasi yang telah disajikan dalam tabel statistik akan memberikan banyak
keterangan bagi peneliti, namun untuk pihak lain dibutuhkan analisis lebih jauh
sehingga data tersebut dapat dimengerti. Oleh karena itu, dibutuhkan langkah
selanjutnya yang dinamakan analisis data.
Kesalahan dalam Analisis Statistik
Dalam menganalisis data statistik diperlukan jaminan
ketepatan informasi tentang persoalan tersebut sehingga data harus diukur
secara pasti. Ada beberapa kesalahan informasi yang bisa muncul saat kita
melakukan analisis data, yakni kesalahan kebetulan dan kesalahan sistematis.
Kesalahan kebetulan adalah kesalahan yang bersifat tidak
disengaja saat mengukur, mencatat, atau memasukkan data pada tabel statistik.
Sementara itu, kesalahan sistematis adalah kesalahan yang sifatnya disengaja.
Kesalahan ini bisa ditemukan jika responden mengemukakan sesuatu yang tidak
sesuai dengan keadaan sebenarnya. Kesalahan sistematis dalam analisis statistik
pun bermacam-macam, antara lain :
·
Bias, yakni kesalahan dalam
penggunaan analisis statistikyang berupa penyimpangan yang tidak
disadari oleh si pengguna data.
·
Data yang tidak komparabel, yakni
kurang adanya perbandingan data statistik yang sedang diteliti dengan data lain
yang relevan pada kurun waktu tertentu.
·
Asumsi yang tidak tepat, yakni
hubungan sebab akibat yang membuat adanya data statistik sebagai representasi
suatu persoalan.
·
Perbandingan dengan periode yang
tidak normal. Hal ini dapat menimbulkan kesalahan pada data statistik sehingga
periode yang tidak normal dianggap sebagai periode normal.
·
Sampling yang tidak tepat juga akan menimbulkan kesalahan pada
analisis statistik karena sebagian besar analisis menggunakan sampling sebagai
dasar dalam mengambil simpulan dan keputusan selanjutnya terhadap persoalan
tersebut.
Jenis Data Statistik
Dilihat dari sumber dan penggunaannya, data statistik
dibedakan menjadi data intern dan data ekstern. Data intern adalah data yang
dikumpulkan oleh suatu badan, dan hasil pengumpulan datanya pun digunakan untuk
kepentingan badan tersebut. Sementara itu, yang dimaksud dengan data ekstern
adalah data yang tidak terdapat dalam aktivitas intern suatu badan.
Data ini dapat diperoleh dari sumber lain seperti majalah,
surat kabar, atau badan lainnya yang menyediakan data statistik tersebut. Selain
dilihat dari sumber dan penggunaannya, data statistik juga dapat
diklasifikasikan menjadi beberapa jenis data berdasarkan sumber dan proses
pengumpulannya, yakni data primer dan data sekunder.
Data primer adalah data yang dikumpulkan oleh suatu badan dan
diterbitkan oleh badan tersebut. Badan lain pun, baik badan swasta maupun
pemerintah, dapat memeroleh data statistik tersebut. Sementara data sekunder
adalah data yang dilaporkan oleh suatu badan. Badan tersebut tidak melakukan
pengumpulan data statistik secara independen, melainkan diperoleh dari pihak
lain yang telah mengumpulkan data tersebut terlebih dahulu.
Selain keempat jenis data statistik di atas, ada juga yang
disebut dengan data diskrit dan data kontinyu. Data diskrit adalah data yang
hanya memunyai jumlah nilai yang terbatas, seperti pada nilai banyaknya muris,
hewan ternak, dan hasil panen. Data diskrit juga sering disebut nilai
pengamatan karena merupakan hasil dari pengamatan suatu persoalan kuantitatif.
Data kontinyu atau sering juga disebut nilai pengamatan
kuantitatif kontinyu adalah data yang secara teoretis dapat menjalani setiap
nilai, misalnya nilai pada pengukuran panjang, isi, berat, waktu, dan
lain-lain. Nilai dari data statistik tersebut bersifat tidak terbatas sehingga
penelitian dan pengukuran harus dilakukan secara cermat dan teliti agar tidak
menimbulkan kesalahan pada datastatistik akhir.