Р Оквир података: Како креирати, додати, изабрати и подскуп

Шта је оквир података?

ДО оквир података је листа вектора једнаке дужине. Матрица садржи само једну врсту података, док оквир података прихвата различите типове података (нумеричке, карактерне, факторске итд.).

У овом водичу ћете научити-

Како створити оквир података

Оквир података можемо креирати у Р тако што ћемо променити променљиву а, б, ц, д у функцију дата.фраме (). Можемо креирати оквир података и назвати колоне именом () и једноставно навести име променљивих. | _+_ |

Аргументс :

  • дф : То може бити матрица за претварање као оквир података или збирка променљивих за придруживање
  • стрингсАсФацторс : Подразумевано претвара низ у фактор

Можемо креирати оквир података у Р за наш први скуп података комбиновањем четири променљиве исте дужине. | _+_ |

Излаз:

data.frame(df, stringsAsFactors = TRUE) 

Можемо видети да заглавља колона имају исто име као и променљиве. Можемо променити назив колоне у Р помоћу назива функција (). Проверите пример креирања оквира података Р цреате испод: | _+_ |

Излаз:

 # Create a, b, c, d variables a <- c(10,20,30,40) b <- c('book', 'pen', 'textbook', 'pencil_case') c <- c(TRUE,FALSE,TRUE,FALSE) d <- c(2.5, 8, 10, 7) # Join the variables to create a data frame df <- data.frame(a,b,c,d) df 
 ## a b c d ## 1 1 book TRUE 2.5 ## 2 2 pen TRUE 8.0 ## 3 3 textbook TRUE 10.0 ## 4 4 pencil_case FALSE 7.0 

Излаз:

 # Name the data frame names(df) <- c('ID', 'items', 'store', 'price') df 

Подразумевано, оквир података враћа низ променљивих као фактор.

Слице Дата Фраме

Могуће је СЛИЦЕ вредности оквира података. Бирамо редове и колоне за враћање у заграду испред имена оквира података.

Оквир података се састоји од редова и колона, дф [А, Б]. А представља редове, а Б колоне. Можемо исећи било навођењем редова и/или колона.

Са слике 1, леви део представља редови, а десни део је колоне . Имајте на уму да симбол: значи до . На пример, 1: 3 намерава да одабере вредности од 1 до 3.

У доњем дијаграму приказујемо како приступити различитом избору оквира података:

  • Жута стрелица бира ред 1 ин колона 2
  • Зелена стрелица бира редове 1 до 2
  • Црвена стрелица бира колона 1
  • Плава стрелица бира редове 1 до 3 и колоне 3 до 4

Имајте на уму да ће, ако оставимо леви део празан, изабрати Р. сви редови . По аналогији, ако десни део оставимо празним, Р ће изабрати све колоне .

Код можемо покренути у конзоли: | _+_ |

Излаз:

 ## ID items store price ## 1 10 book TRUE 2.5 ## 2 20 pen FALSE 8.0 ## 3 30 textbook TRUE 10.0 ## 4 40 pencil_case FALSE 7.0
 # Print the structure str(df) 

Излаз:

 ## 'data.frame': 4 obs. of 4 variables: ## $ ID : num 10 20 30 40 ## $ items: Factor w/ 4 levels 'book','pen','pencil_case',..: 1 2 4 3 ## $ store: logi TRUE FALSE TRUE FALSE ## $ price: num 2.5 8 10 7 
## Select row 1 in column 2 df[1,2]

Излаз:

## [1] book ## Levels: book pen pencil_case textbook
 ## Select Rows 1 to 2 df[1:2,]

Излаз:

 ## ID items store price ## 1 10 book TRUE 2.5 ## 2 20 pen FALSE 8.0

Такође је могуће изабрати колоне са њиховим именима. На пример, доњи код издваја две колоне: ИД и продавницу. | _+_ |

Излаз:

## Select Columns 1 df[,1]

Додајте колону у оквир података

Такође можете додати колону у оквир података. Морате да користите симбол $ за додавање променљиве оквира података Р и додавање колоне у оквир података у Р. | _+_ |

Излаз:

## [1] 10 20 30 40

Напомена: Број елемената у вектору мора бити једнак броју елемената у оквиру података. Извршавање следеће наредбе за додавање колоне у оквир података Р.

## Select Rows 1 to 3 and columns 3 to 4 df[1:3, 3:4]

Даје грешку:

 ## store price ## 1 TRUE 2.5 ## 2 FALSE 8.0 ## 3 TRUE 10.0

Изаберите колону оквира података

Понекад морамо да сачувамо колону оквира података за будућу употребу или да изведемо операције на колони. Можемо да користимо знак $ да изаберемо колону из оквира података. | _+_ |

Излаз:

# Slice with columns name df[, c('ID', 'store')]

Подскупите оквир података

У претходном одељку изабрали смо целу колону без услова. Могуће је да подсет на основу тога да ли је одређени услов био испуњен.

Користимо функцију субсет (). | _+_ |

Желимо да вратимо само артикле чија је цена већа од 10, можемо учинити: | _+_ |

Излаз:

 ## ID store ## 1 10 TRUE ## 2 20 FALSE ## 3 30 TRUE ## 4 40 FALSE