0%

2022-1-23周记

改了一下周记的记录方式,打算把周记放在一周内记录,即什么时候有想法了什么时候就写一下,然后周日整理一下。

1-20记录:

【科学】

今天早上刷B站视频有个武大博士提到检索论文的时候注意检索对应学科的数据库,于是搜了搜武大和北大图书馆的期刊数据库,发现人文社科和管理学两个按钮,所以想着仔细查查像人文社科、自然科学、社会科学等名词的分类。

分类:

        前两个没有什么疑问,人文方面,一些学者喜欢称之为人文科学,但是也有学者认为“不要把人文学科称为人文科学,因为这些学科与自然科学或科学的距离实在是太大了,差异太明显了。我们说人文学科是非科学( 严格地讲,大多数社会科学学科也属于非科学的范畴) ,并不是贬低它,而仅仅是说它不是自然科学而已; 事实上,它与自然科学同样有意义,也许在某些方面比自然科学更有价值。

        概括来讲,自然科学指的是实验科学或经验科学,也就是说时基于经验的;而社会科学则是以社会为研究对象,目标在于认识各种社会现象并尽可能找出它们之间的关联,研究人与物或人与人之间的关系;人文学科则是一个学科群,研究人本身或与个体精神直接相关的信仰、情感、心态、理想、道德、审美、意义、价值等的各门科学的总称。

具体学科

        参照中国社会科学基金和国家自然科学基金的目录,有以下数据:

社会科学:2022年国家社会科学基金申报代码

马列·科社、党史·党建、哲学、理论经济、应用经济、统计学、政治学、法学、社会学、人口学、民族问题研究、国际问题研究、中国历史、世界历史、考古学、宗教学、中国文学、外国文学、语言学、新闻学与传播学、图书馆情报与文献学、体育学、管理学

自然科学:2022年国家自然科学基金申请代码

数理科学、化学科学、生命科学、地球科学、工程与材料科学、信息科学、管理科学、医学科学、交叉科学

其中像管理学、经济学等学科有一定程度的交叉。

人文学科

西洋古典学、人类学、 宗教 、哲学、 语言学、文学、 艺术、艺术学、 人文地理学等。

参考文献: 李醒民.知识的三大部类:自然科学、社会科学和人文学科[J].学术界,2012(08):5-33+286.


汇总

这周主要解决了几个比较难缠的问题

一个是给电脑装子系统,配置了好久,因为子系统跟虚拟机还不一样,各种配置都是单独的设置,所以出的问题也跟虚拟机下出的问题不一样,好处就是方便,没有虚拟机那么臃肿。

一个是学习小组的任务结束了,虽然任务不多,但是把这些知识集中到几天每天连续打卡学习还是有些吃力,因为家里跟学校里不一样,家里总会有各种各样的事情导致进程中断。

大外甥回家了,上周总结提到的看孩子的意思就是照顾我大外甥,我姐和我姐夫上班,我放寒假就正好看孩子。

另外这周同步进行的任务还有

学习Docker 的相关内容

回顾一下Django知识

文献阅读

        首先是了解了知识图谱和Cite Space,忘了是什么原因去搜CiteSpace了。知识图谱之前也了解过一些,但是没有深入学习。因为最早是谷歌等搜索引擎公司应用的知识图谱(Knowledge Graph),所以很多知识图谱的介绍都是用“通过谷歌搜索一个人名,谷歌如何知道应该给你显示哪个人的结果”的例子,即通过分析各个实体之间的关系构建知识库从而使搜索结果结构化。而CiteSpace也是相似的思路:分析一定时期的论文,将一个知识领域来龙去脉的演进历程集中展现在一幅引文网络图谱上,并把图谱上作为知识基础的引文节点文献和共引聚类所表征的研究前沿自动标识出来。所以CitSpace常用于文献综述等相关方面,比如展示作者发文及交流程度、机构发文及交流程度、高频关键词以及关键词聚类等。而且CiteSpace的使用也越来越频繁,知网期刊以主题为(CiteSpace(精确))搜索时,从2007年的两篇,增加到2021年的2205篇,被引量最高的 陈悦,陈超美,刘则渊,胡志刚,王贤文.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(02):242-253.DOI:10.16192/j.cnki.1003-2053.2015.02.009. 指出从2003 年美国国家科学院在研讨会正式提出知识图谱到2005年陈悦教授等人在国内率先命名和引入科学知识图谱,知识图谱和CiteSpace在国内的发展十分迅速。不过虽然CiteSpace的一些功能都很直观,但是像聚类、共现网络等,软件会进行一些额外的标准化以及算法中的参数值调整,这些东西还需要额外的学习,并不是直接载入数据然后生成论文就可以的。因为软件中的操作都是可视化的,以前在用Python学习聚类分析时,都是代码层面,一个是不用就会经常忘,另一个是生成的图片也需要不断调整, 直接可视化的话会省很多力气。不知道以后能不能用上。

        然后这周也看了几篇政府舆情处理的论文,这个起源是最近疫情的原因和部分政府官员的行为引起的社会舆论。包括从系统动力学(没有系统学习过)进行仿真、基于各种案例的案例分析和实证分析等。但是越读越不舒服,那要是政府一直不回应,你怎么建模怎么分析不都没用吗。这也是钻牛角尖的气话了,研究不都有假设吗,没有假设还怎么研究了。

        英文文献发现了一篇“The effect of TV drama piracy: An analysis of digital piracy users, internet buzz, and TV drama viewership”-“电视剧盗版的影响:数字盗版用户、网络热度和电视剧收视率的分析”,很有意思。因为很多的研究都是对音乐、电影等一次发行的数字产品进行的,许多电视剧是按集发行,所以作者就研究了在一部电视剧的整个发行过程中,盗版对于正版收视率的影响。主要的研究主体是互联网的中介作用、数字盗版的替代效应以及注意力效应。结论是“加强对盗版频道提供的早期剧集的访问可能有助于后期剧集的合法消费”。实证的过程比较复杂,作者们收集了 2018 年 3 月上旬至 2018 年 6 月上旬在美国播出的 20 部电视剧的收视率数据、每一集的的BitTorrent盗版用户数量、相应时期的Google和Youtube趋势、Twitter推文以及IMDB评分。然后对各种变量间进行不同的组合并进行分析然后解释结论。

        注意力效应—这里原文是Attention Effects,在谷歌分别以注意力效应和“Attention Effects”为关键词搜索时,感觉最贴合论文中的意思是应该是注意力分散效应。因为论文中是用网络媒体和盗版用户数量来研究“Attention Effects”的,即研究网络热度的增加和盗版下载数量与正版收视率的关系。不过这个关系之间包含了许多变量和检验方法,比如推特推文数、Youtube相关内容观众数量、谷歌搜索数量等。检验方法中主要的方法是双尾检验,但是这个检验方法具体是怎么使用的还没搞懂,不过作者们几乎在每个研究相互作用因素的表格中的脚注中几乎都提到了这个检验,所以这应该是这篇论文的主要检验方法了。模型的话,作者在之前一个学者的论文提出的模型中进行变量的重新赋值,进行模型的分析。

        题外话,中国的盗版资源统计用户要比国外难太多了,因为在论文中作者使用的BitTorrent的用户数,这是p2p下载技术,而开源的下载程序可以很方便的显示资源的下载数,但是在国内,移动互联网催生了大量的大大小小的网盘公司,而每个网盘公司都有着自己的闭源终端,所以就盗版用户数量方面,统计还是十分困难的。