W analizie danych możesz sortować dane według określonej zmiennej w zbiorze danych. W R możemy skorzystać z pomocy funkcji order (). W R możemy łatwo posortować wektor zmiennej ciągłej lub zmiennej czynnikowej. Porządkowanie danych może być w kolejności rosnącej lub malejącej .
Składnia:
sort(x, decreasing = FALSE, na.last = TRUE):
Argument:
- x : wektor zawierający zmienną ciągłą lub czynnikową
- malejąco : kontrola kolejności metody sortowania. Domyślnie zmniejszanie jest ustawione na „FALSE”.
- last : Wskazuje, czy wartość „NA” powinna być umieszczona na końcu, czy nie
Przykład 1
Na przykład, możemy utworzyć ramkę danych tibble i posortować jedną lub wiele zmiennych. Ramka danych tibble to nowe podejście do ramki danych. Poprawia składnię ramek danych i pozwala uniknąć frustrującego formatowania typu danych, szczególnie w przypadku współczynników. Jest to również wygodny sposób na ręczne tworzenie ramki danych, co jest naszym celem tutaj. Aby dowiedzieć się więcej o tibble, zapoznaj się z winietą: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html
library(dplyr)set.seed(1234)data_frame <- tibble(c1 = rnorm(50, 5, 1.5),c2 = rnorm(50, 5, 1.5),c3 = rnorm(50, 5, 1.5),c4 = rnorm(50, 5, 1.5),c5 = rnorm(50, 5, 1.5))# Sort by c1df <-data_frame[order(data_frame$c1),]head(df)
Wynik:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 1.481453 3.477557 4.246283 3.686611 6.0511003## 2 1.729941 5.824996 4.525823 6.753663 0.1502718## 3 2.556360 6.275348 2.524849 6.368483 5.4787404## 4 2.827693 4.769902 5.120089 3.743626 4.0103449## 5 2.988510 4.395902 2.077631 4.236894 4.6176880## 6 3.122021 6.317305 5.413840 3.551145 5.6067027
Przykład 2
# Sort by c3 and c4df <-data_frame[order(data_frame$c3, data_frame$c4),]head(df)
Wynik:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 2.988510 4.395902 2.077631 4.236894 4.617688## 2 2.556360 6.275348 2.524849 6.368483 5.478740## 3 3.464516 3.914627 2.730068 9.565649 6.016123## 4 4.233486 3.292088 3.133568 7.517309 4.772395## 5 3.935840 2.941547 3.242078 6.464048 3.599745## 6 3.835619 4.947859 3.335349 4.378370 7.240240
Przykład 3
# Sort by c3(descending) and c4(acending)df <-data_frame[order(-data_frame$c3, data_frame$c4),]head(df)
Wynik:
# A tibble: 6 x 5## c1 c2 c3 c4 c5#### 1 4.339178 4.450214 8.087243 4.5010140 8.410225## 2 3.959420 8.105406 7.736312 7.1168936 5.431565## 3 3.339023 3.298088 7.494285 5.9303153 7.035912## 4 3.397036 5.382794 7.092722 0.7163620 5.620098## 5 6.653446 4.733315 6.520536 0.9016707 4.513410## 6 4.558559 4.712609 6.380086 6.0562703 5.044277