0%

2022-2-12周记

年后第一篇周记,时间过的好快啊

上周:

        过年七天乐,其实每次在家,“过年”至少会持续到初八九,亲戚比较多,光走亲戚走了好几天,过年感觉越来越累了,上学的催毕业、不上学的催结婚、没对象的被催、没结婚的被催、生一个的还被催,虽然都催的不太过分,但是还是有点闹腾。

        过年的时候也没看几篇论文,倒是把《深入浅出docker》的单机部分看的差不多了,分布式操作因为只有一个电脑,没法折腾了,买了甲骨文和腾讯云的两个服务器不知道为啥也相互连不上,书上好像用的局域网。学Docker的一个原因,是因为之前买过很多次服务器,每次装个东西都会附带安装一大堆的依赖程序,可是当你卸载某个软件的时候,这些依赖该不该卸载又是问题,并且还会占据很多端口,让人就很不爽 ,整理起来又很麻烦,因为Linux也只是学到了能用的地步,毕竟主力机器不是Linux,没有必要学的那么深入,这玩意不用的话忘得太快了。于是Docker就出现了,“应用即容器”,很舒服,把每个应用放在单独的容器中,相互之间互不干扰,太爽了!

        大年初一早上收到了来自Github的邮件,我排队了数个月的Github Copilot内测权限终于通过审核了,它是OpenAi跟GitHub基于GPT-3做的Codex引擎的产物,朴素的叙述就是可以更加智能的进行文本补全。不仅是写代码,还包括所有的文本输入,试了一周,比较不错,中文补全还是差点意思,但是代码补全十分强,可以省好多事儿。最强的是,它可以根据注释补全,比如:你通过注释写出“提取字符串中以a开头和c结尾的片段”,他就可以以当前使用的语言进行自动书写,这样你就可以更加专注于逻辑操作而不是过于繁琐的任务。

        感觉没报计算机专业也挺好的,不管是以前还是现在,写代码对我好像是一种放松的状态,没有什么压迫感,没有什么功利性,纯属兴趣爱好。这一周就主要用copilot写了写网页,由于之前用的是tomcat,这次学的是Django,有相似的地方也有比较绕的地方,比如tomcat很多操作是在web-info中的xml文件,而Django都是在py文件中,Bootstrap的设计语言也需要从头开始,前端好复杂,我形象的把前端兄弟成为装修工人,因为实在是太像了,不停的调整,直到 “好用+好看” 双赢。

        学Django的原因是每次整新服务器新域名都是直接用现成的程序生成网站,DIY程度也不太高,当然自己水平也不行,于是想自己写个网页增加点小工具啥的,正好Django是用Python做的底层支持,学习起来能少一个熟悉语言的步骤,并且Django是热拔插的框架,上线新功能直接是通过注册app的步骤实现,对于我这种 “非正规军” 十分的方便!

本周:

        这一周就过的稍微有点快了,周一在同学家,周二姑姑家姐姐结婚,周三学了学网页,周四玩了一下子,周五干啥了,昨天在姥姥家待了一天因为今天去医院。好快的一周过去了,可是还没精读论文。老师批改里提到的最后一次周记里的 《基于“蚂蚁金服”事件网评文本的互联网金融监管蕴意挖掘》,我找了找相关的文献,和这个论文的参考文献,略读了摘要和方法部分,大多数的中文文本挖掘都是基于社会热点和舆论事件,也有像在财报披露中进行文本分析的研究,具体应该怎么结合技术经济或者管科,还是应该多看多总结。

另外,我发现图情类的核心期刊这方面的文献占比比较多,于是又订阅了情报理论、情报科学、图书情报工作等期刊的RSS链接,希望能有所收获。

下周:

        首先还是看论文吧,历史证明,不能立太高的flag,我觉得可以在看论文的时候再细致点,至少总结出论文主要的研究方向和研究方法应该不难吧。

        目前暂时想继续检索的论文方向是 “文本挖掘 + 社会热点” ,但是通过上面的参考文献中,文本挖掘的方向太多了,有实体分析、传播路径分析、情感变化分析、意见领袖等等,具体与专业方向结合还得接着多看多总结。

另外这周,还做了个自己用的论文管理软件的测试,目前我用的主要是知网的全球学术快报+ Zotero + Mendeley。全球学术快报比较好的一点是全平台同步阅读记录,不过不能高级搜索,很鸡肋,每次都需要在知网检索完以后再在全球学术快报里重新搜索添加。zotero可以直接在word里引用文献和生成参考文献页面,很方便,但是这个版本更新后,用来拉取知网文献数据的插件坏了,有点难受。Mendeley就像个网盘一样,把所有的文件都直接上传,本地只有缓存文件,跨平台很好用。但是就是得手动上传。最后选了个折中的方案,把阿里云盘挂载到本地,然后每次下载论文就直接下载到阿里云盘里,也不限速,容量也不小,很舒服,也不用担心论文到处存的乱七八糟了。