我有这个数据框,“数据”,包含大约每半小时收集一整年的数据,但有些日子只收集了几小时的数据。如何计算每小时在R中收集的天气变量数据的日平均值,中位数?
日期的格式为:31.01.2010 00:30
(都在同一个小区) 变量是:Temperature
,humidity
,PM10
,windspeed
等
第一个问题:我如何计算每天的手段,中位数,最大值,最小值,这些变量的值,因此我可以在进一步的分析中进行测试,例如使用GAM进行生存分析),而不是每小时/每半小时的数据?
显然,计算出日平均/中位数应该被分配到相应的日期。
第二个问题:DATES
列同时包含日期和时间,在同一个单元格中由一个空格分隔。 在R,它的类型是'Factor'
,我不能做任何计算,因为错误"dates" is missing
出现。
我的猜测是,我需要先将它从Factor
转换为date/time
,这样才能识别它,然后计算均值/中值。但我该怎么做?
你能请注明这将是自变量/函数使用?
我认为我已经解决了从'Factor'到POSIXlt的日期转换:我使用了函数strptime(Data $ DATES,format =“%d。%m。%Y%H:%M”)和现在$日期是公认POSIXlt,格式为“2010-01-01 00:00:00” ......
但我仍然需要找到一个计算日平均或平均数或中位数或任何功能。
我认为我已经解决了日期从“要素”来POSIXlt转换:我使用的功能strptime(Data $ DATES,format =“%d。%m。%Y%H:%M”),现在$ DATES被识别为POSIXlt格式“2010-01-01 00:00:00”.... –
删除了'生存分析'和'gam'标记,因为它们都不适用于这个问题。 –