0%

2022-06-26周记

好快好快好快

论文

引言

这周整理了整理小论文的第一章,然后就转头规划数据处理这部分了。

数据的问题卡在一个很尴尬的地方,就是时间的起始点。

通常这种根据微博数据的,都是根据某个或者某些具体事件,而这些事件都有具体的开始时间和热度最高时间,并且热度都很高,也就是讨论量很高,但是老龄化这些话题,普遍是阅读量很高但是讨论量不高,我只能拉长时间跨度。本来是用的开始时间是18年1月1日,也就是《中华人民共和国老年人权益保障法》修正的当年,但是整体时间跨度太长了,18年1月1日到22年5月1日。所以我就想着缩成19年1月1日到22年6月1日,也就是疫情期间,但是数据量又比较少,总共爬了有七万来条。可能微博也限制了一些抓取操作。

下一步我觉得先把整体的数据处理捋一遍,比如每一步做什么,怎么做,把流程先写好程序,等数据范围定下来以后,爬好数据直接扔进程序里出结果了,当然新数据里边也可能涉及一些隐藏信息,也可能需要重新走一遍流程。不过大多数数据清洗操作应该都是一样的,主要就是应该深入到什么地步。

另外这两天爬数据的时候老是被禁,属实有点难受。

其他

上次买书的时候一次买了好几本,这周把王小波的《沉默的大多数》看完了。每次看王小波的书都很享受,总是能用最朴实的语言把他那个年代的社会现实阐述的淋漓尽致,甚至很多事情放在现在也毫不违和。看过的上一本王小波的书是《爱你就像爱生命》,是王小波和李银河的书信集,十分羡慕这种“伟大的革命友谊”,也很遗憾,还没有经历过这种“伟大革命友谊”。最初看的一本是《黄金时代》,算是中篇小说,不过还是大一的时候读的了,只记得当时看的时候很惊叹,但是书里的内容不太记得了,有机会一定要再读一次。

另一件事就是重装了一下电脑,我电脑东西太多了,重装的时间成本太高了,来来回回硬是折腾了两天才把之前的软件弄好。微软虽然发了新系统win11,但是对硬件要求很严格,我就偏偏不信邪,寒假的时候各种折腾终于装上了11,但是折磨了我一个学期,学校网速慢,重装系统更费劲了,这两天整理了一下需要重装的东西,一口气装完了,win10太清爽了。