官方社群在线客服官方频道防骗查询货币工具

基于词典的社交媒体内容的情感分析(Python实现)

2025年01月10日 03:23:25
news.like.tgnews.like.tgnews.like.tgnews.like.tg

LIKE.TG 成立于2020年,总部位于马来西亚,是首家汇集全球互联网产品,提供一站式软件产品解决方案的综合性品牌。唯一官方网站:www.like.tg

之前写了一篇基于NLTK情感预测的文章https://www.omegaxyz.com/2017/12/15/nltk_emotion/?hilite=%27NLTK%27b

情感词典是从微博、新闻、论坛等数据来源的上百万篇情感标注数据当中自动构建的情感极性词典。因为标注包括微博数据,该词典囊括了很多网络用语及非正式简称,对非规范文本也有较高的覆盖率。该情感词典可以用于构建社交媒体情感分析引擎,负面内容发现等应用。

这是一个基于机器学习的已生成的情感词典(txt文档),注意只能预测社交媒体等非规范性文本(文章情感预测精度有误差)

词典下载:https://bosonnlp.com/resources/BosonNLP_sentiment_score.zip

python实现是利用jieba分词预测

Python

代码语言:txt
复制
import time import jieba emotion_dic = {} filename = 'BosonNLP_sentiment_score.txt' # txt文件和当前脚本在同一目录下,所以不用写具体路径 with open(filename, 'rb') as file: while True: try: senList = file.readline().decode('utf-8') # print(senList) senList = senList[:-1] senList = senList.split(' ') emotion_dic[senList[0]] = senList[1] except IndexError: break def get_emotion(score): emotion_archive = ['绝望,十分愤怒,对生活不在抱有希望', '难过,失望,抑郁', '有点小难过或者小愤怒', '轻微的难受或者不屑,想得太多啦,洗洗睡觉吧', '生活也就这样吧', '有点小开心或者小激动', '蛮开心的,生活多美好', '喜笑颜开,每天的太阳都是新的,生活充满了希望'] if score <= -3.9: return emotion_archive[0] elif -3.9 < score <= -2.5: return emotion_archive[1] elif -2.5 < score <= -1: return emotion_archive[2] elif -1 < score <= 0: return emotion_archive[3] elif 0 <score <= 1: return emotion_archive[4] elif 1 < score <= 2.5: return emotion_archive[5] elif 2.5 < score < 3.9: return emotion_archive[6] else: return emotion_archive[7] test = "才拒绝做爱情代罪的羔羊" seg_list = jieba.cut(test, cut_all=True) string = "/ ".join(seg_list) string_list = string.split('/') emotion_index = 0 time.sleep(1) print("-5分为极端消极,5分为非常高兴") for _ in range(len(string_list)): if string_list[_] in emotion_dic: emotion_index += float(emotion_dic[string_list[_]]) print(emotion_index) print(get_emotion(emotion_index))

测试文本来自陈奕迅《爱情转移》中“才拒绝做爱情代罪的羔羊”

结果:

-0.730524151526 轻微的难受或者不屑,想得太多啦,洗洗睡觉吧

网站所有原创代码采用Apache 2.0授权 网站文章采用知识共享许可协议BY-NC-SA4.0授权

现在关注【LIKE.TG出海指南频道】【LIKE.TG大客户服务频道】,即可免费领取【WhatsApp、LINE、Telegram、Twitter、ZALO云控】等获客工具试用、【住宅IP、号段筛选】等免费资源,机会难得,快来解锁更多资源,助力您的业务飞速成长!点击【联系客服】

本文由LIKE.TG编辑部转载自互联网并编辑,如有侵权影响,请联系官方客服,将为您妥善处理。

This article is republished from public internet and edited by the LIKE.TG editorial department. If there is any infringement, please contact our official customer service for proper handling.


Server deployment全球论坛人工智能论坛全球峰会发展论坛战略论坛开放论坛程序员论坛互联网峰会科技峰会
加入like.tg生态圈,即可获利、结识全球供应商、拥抱全球软件生态圈加入like.tg生态圈,即可获利、结识全球供应商、拥抱全球软件生态圈加入like.tg生态圈,即可获利、结识全球供应商、拥抱全球软件生态圈
加入like.tg生态圈,即可获利、结识全球供应商、拥抱全球软件生态圈加入like.tg生态圈,即可获利、结识全球供应商、拥抱全球软件生态圈加入like.tg生态圈,即可获利、结识全球供应商、拥抱全球软件生态圈