Statistik Open Source

Setelah sebelumnya kita memakai dasar dari R untuk menggunakan order perangkingan data. Sekarang tidak ada salahnya kita mencoba dengan menggunakan package tidyverse. Tidyverse merupakan sekumpulan package R yang memiliki suatu sistem sendiri. Terdiri dari ggplot2, tibble, dplyr, tidyr, readr, purr, stringr dan forcat. Tidyverse banyak digunakan untuk mengolah data dalam jumlah besar sehingga lebih slim, neat dan mudah dipahami. Tidyverse dikembangkan oleh Sang ahli statistikawan asal New Zealand Hadley Wickham. Semenjak dikenalkan pada sekitaran tahun 2009-2010 pengguna aliran tidyverse sudah melonjak drastis, meninggalkan konsep lama yang dianggap kurang adapt dengan perkembangan data. Tidyverse mampu mengunduh data langsung dari internet atau dari data warehouse SQL. Berikut cara melakukan orderisasi dengan tidyverse:

head(data_1)
  subject_id trial   RT akurasi  tipe_trial          sub_trial
1  extrovert     6  567       1   congruent   congruent_letter
2  extrovert     2 1119       1 incongruent incongruent_number
3  extrovert     3  843       1   congruent   congruent_number
4  extrovert     4  823       1   congruent   congruent_letter
5  extrovert     0  985       1 incongruent incongruent_number
6  extrovert     1  867       1   congruent   congruent_number
> data_subject <- data_1 %>% group_by(subject_id)
> data_subject %>% arrange(desc(RT))
# A tibble: 640 x 6
# Groups:   subject_id [2]
   subject_id trial    RT akurasi tipe_trial  sub_trial         
   <fct>      <int> <int>   <int> <fct>       <fct>             
 1 introvert      5 18660       0 incongruent incongruent_letter
 2 introvert      4 14081       1 congruent   congruent_letter  
 3 introvert      5 14041       1 incongruent incongruent_letter
 4 extrovert      7 13108       0 incongruent incongruent_letter
 5 extrovert      5 11754       1 incongruent incongruent_letter
 6 extrovert      2 11643       1 incongruent incongruent_number
 7 introvert      5 11349       0 incongruent incongruent_letter
 8 introvert      2 11347       1 incongruent incongruent_number
 9 introvert      4 10194       1 congruent   congruent_letter  
10 introvert      0  9259       1 incongruent incongruent_number
# … with 630 more rows
> data_subject %>% arrange(RT, .by_group = TRUE)
# A tibble: 640 x 6
# Groups:   subject_id [2]
   subject_id trial    RT akurasi tipe_trial  sub_trial         
   <fct>      <int> <int>   <int> <fct>       <fct>             
 1 extrovert      7    22       0 incongruent incongruent_letter
 2 extrovert      0    97       0 incongruent incongruent_number
 3 extrovert      1   386       1 congruent   congruent_number  
 4 extrovert      4   425       1 congruent   congruent_letter  
 5 extrovert      3   444       1 congruent   congruent_number  
 6 extrovert      0   463       0 incongruent incongruent_number
 7 extrovert      2   470       1 incongruent incongruent_number
 8 extrovert      7   483       1 incongruent incongruent_letter
 9 extrovert      7   486       1 incongruent incongruent_letter
10 extrovert      2   498       0 incongruent incongruent_number
# … with 630 more rows

> data_subject %>% tbl_df %>% print(n=50)
# A tibble: 640 x 6
   subject_id trial    RT akurasi tipe_trial  sub_trial         
   <fct>      <int> <int>   <int> <fct>       <fct>             
 1 extrovert      6   567       1 congruent   congruent_letter  
 2 extrovert      2  1119       1 incongruent incongruent_number
 3 extrovert      3   843       1 congruent   congruent_number  
 4 extrovert      4   823       1 congruent   congruent_letter  
 5 extrovert      0   985       1 incongruent incongruent_number
 6 extrovert      1   867       1 congruent   congruent_number  
 7 extrovert      5   767       1 incongruent incongruent_letter
 8 extrovert      7   896       1 incongruent incongruent_letter
 9 extrovert      3   744       1 congruent   congruent_number  
10 extrovert      2   807       1 incongruent incongruent_number
11 extrovert      7  1788       1 incongruent incongruent_letter
12 extrovert      6  1083       1 congruent   congruent_letter  
13 extrovert      5  1859       1 incongruent incongruent_letter
14 extrovert      1   970       0 congruent   congruent_number  
15 extrovert      4   947       1 congruent   congruent_letter  
16 extrovert      0  1842       1 incongruent incongruent_number
17 extrovert      2   825       0 incongruent incongruent_number
18 extrovert      5  1200       1 incongruent incongruent_letter
19 extrovert      1  1877       1 congruent   congruent_number  
20 extrovert      0  1019       1 incongruent incongruent_number

Selain integer (int), ada faktor (fct) dan biasanya ada dbl (double). Dalam lingkungan sistem tidyverse juga ada istilah tibble yang sama dengan data frame dan ada tanda pipe (%>%) atau piping data yang memiliki fungsi untuk melakukan serangkaian analisis dalam satu waktu atau chaining formula.

Daftar Artikel