范文网 作文大全 影响抽样评论误差的因素 在线评论投票数的影响因素研究(通用)

影响抽样评论误差的因素 在线评论投票数的影响因素研究(通用)

影响抽样评论误差的因素 在线评论投票数的影响因素研究[摘 要] 在线评论的投票数反映了阅读者对该条评论的关注度,对潜在消费者的购物决策具有很大的参考价值。本文以京东商城热门手机的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从数字特征。

影响抽样评论误差的因素 在线评论投票数的影响因素研究

  [摘 要] 在线评论的投票数反映了阅读者对该条评论的关注度,对潜在消费者的购物决策具有很大的参考价值。本文以京东商城热门手机的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从数字特征、写作风格和语义3个维度研究在线评论投票数的影响因素。研究表明:评论中优点和不足内容是否相同对投票数有显著的正向影响,评论正文的主观性对投票数有显著的负向影响。此外,产品故障词、产品特征词和情感程度词对投票数也有重要影响。
  [关键词] 电子商务; 在线评论; 投票数; 文本挖掘; 语义
  doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 17. 050
  [中图分类号] F713.36 [文献标识码] A [文章编号] 1673 - 0194(2012)17- 0088- 04
  1 引 言
  在线评论被认为是传统口碑的数字化表现形式[1],承载了消费者的直接产品体验,蕴含了大量的管理和决策支持信息。其价值可以从买方和卖方两方面来分析:
  (1) 买方价值:在线评论属于一种无偏产品信息,其可信度大大高于商家的促销信息,对潜在客户的购买决策具有重要影响[2]。
  (2) 卖方价值:厂商可以通过对用户发表的在线评论的研究,来发现用户对本企业产品的满意程度,本产品与同类产品相比的优势和劣势,据此对产品进行改进,从而增强企业竞争力。
  然而,随着在线评论的不断增加,在线评论也出现了信息爆炸时代的普遍问题——信息过载[3-4]。在线评论数量的巨大和质量的参差不齐严重干扰了评论阅读者对产品质量的有效判断,增加了信息搜寻成本,降低了决策的效率[5]。因此,有效地识别在线评论的价值就显得至关重要。
  许多电子商务网站会鼓励阅读者对自己看到的在线评论进行投票,然后利用投票数来评价一条评论的有用性。本文在现有研究的基础上,构建在线评论投票数的影响因素模型。本文的研究目的是更好地解释为什么有的评论会得到较多的投票数,而有的评论只得到很少的投票数。
  本文收集了中国最大的电子产品交易网站——京东商城热门手机的在线评论信息,结合文本挖掘技术和实证研究方法,从数字特征、写作风格和语义3个维度来研究在线评论投票数的影响因素、作用方向和重要程度。本文内容组织如下:第2节,根据相关理论和文献研究提出理论假设,建立在线评论投票数的影响因素模型。第3节,阐述数据采集、处理和实证分析的过程,并对分析结果进行分析和解释。第4节,给出研究结论及其意义,并指出研究局限和后续研究方向。
  2 模型与理论假设
  在之前研究的基础上,本文构建的在线评论投票数影响因素模型如图1所示。
  2.1 数字特征维度
  数字特征指的是不涉及文本内容的信息,包括:① 产品的平均得分,记为AvgScore。② 评论者评分,记为Rating。③ 评论发表距今的时间间隔,记为ElapsedDay。④ 评论者是否填写了产品的不足,记为NoDisadv。
  文献[6]研究表明评论者是否填写了产品的不足对投票数没有显著影响,这与之前的研究略有出入。消费者通常会认为负面信息比正面信息更具诊断价值,因而在做购买决策时更多地依赖负面信息[5] ,而产品的不足反映的正是其负面信息,由此,本文提出假设H1。
  H1:评论者是否填写了产品的不足对投票数有显著的正向影响。
  2.2 写作风格维度
  写作风格反映了评论人写作的特点。写作风格主要体现在正文各部分内容(优点、不足和使用心得)是否相同,文本长度,平均句长和评论的主观性等方面。
  评论可以分为标题和正文。标题通常比较短,评论者的写作风格主要体现在正文里,所以本文中写作风格主要指的是正文风格。写作风格包括:① 正文各部分内容(优点、不足和使用心得)是否相同,记为Same。② 文本长度。评论分为标题和正文两部分,标题长度记为TitLen,正文长度记为ConLen。本文将长度作为文本信息量的一个度量指标。③ 平均句长,记为AvgLen。④ 评论的主观性,记为Sub。本文把评论中形容词所占比重作为评论主观性的代理指标。
  正文各部分内容(即优点、不足和使用心得)是否相同以及评论的主观性是本文新加入模型的影响因素。
  评论者在优点、不足和使用心得中填写相同的内容,可能的原因是:用重复来强调自己满意或者不满意的强烈情感;发表评论仅为了获得网站的积分,复制粘贴可以节约时间。基于以上的分析,并不能断定正文各部分内容是否相同对投票数的影响是正向还是负向。正文分为优点、不足和使用心得3部分,通常来讲,优点是对产品的正面评价,不足是对产品的负面评价,使用心得是对产品的总体评价,表达正面情感或者负面情感均可。若优点和不足填写了相同的内容,评论者可能是想通过这种重复来强调自己的某种情感(满意或者不满意),那么它对投票数有正向影响;若使用心得和优点或者是不足内容相同,这样就会减少评论的信息量,可能会对投票数有负向影响。由此,本文提出假设H2。
  H2:正文各部分内容是否相同对投票数有影响,但不确定是正向还是负向。
  H2a:评论优点和不足内容是否相同对投票数有显著的正向影响。
  H2b:评论优点和使用心得内容是否相同对投票数有显著的负向影响。
  H2c:评论不足和使用心得内容是否相同对投票数有显著的负向影响。
  文献[7]把评论文本内容分为客观和主观两类。文献[8]研究了文本的主观性对在线评论有用性的影响,结果发现,评论的主观性越大,评论的有用性越低。由此,本文提出假设H3。
  H3:评论的主观性对评论的投票数有显著的负向影响。
  2.3 语义维度
  文献[6]研究表明语义是影响投票数的重要因素,但是并没有深入研究每一个词语对投票数的影响,且由于采用了因子分析的方法,实验结果比较难以解释。挖掘重要产品特征和判断评论观点的情感倾向是在线评论挖掘的两个很重要的方面[9],所以本文假设产品特征和观点的强烈程度对投票数有显著影响。文献[5,10]都直接把评论者评分作为评论者情感倾向的代理指标,并未从语义的角度来考虑情感倾向及其程度,所以本文将通过情感程度词来展现评论者情感强烈程度。本文扩展了原模型中语义对投票数的影响,从产品特征词(记为Feature)、产品故障词(记为Breakdown)和情感程度词(记为SenDe) 3方面来研究语义对投票数的影响。

上一篇
下一篇
返回顶部