官方社群在线客服官方频道防骗查询货币工具

基于词典的社交媒体内容的情感分析(Python实现)

基于词典的社交媒体内容的情感分析(Python实现)伊伊
2025年01月10日📖 4 分钟
LIKE.TG 社交媒体链接LIKE.TG 社交媒体链接LIKE.TG 社交媒体链接LIKE.TG 社交媒体链接
Fansoso粉丝充值系统

LIKE.TG | 发现全球营销软件&服务汇聚顶尖互联网营销和AI营销产品,提供一站式出海营销解决方案。唯一官网:www.like.tg

之前写了一篇基于NLTK情感预测的文章https://www.omegaxyz.com/2017/12/15/nltk_emotion/?hilite=%27NLTK%27b

情感词典是从微博、新闻、论坛等数据来源的上百万篇情感标注数据当中自动构建的情感极性词典。因为标注包括微博数据,该词典囊括了很多网络用语及非正式简称,对非规范文本也有较高的覆盖率。该情感词典可以用于构建社交媒体情感分析引擎,负面内容发现等应用。

这是一个基于机器学习的已生成的情感词典(txt文档),注意只能预测社交媒体等非规范性文本(文章情感预测精度有误差)

词典下载:https://bosonnlp.com/resources/BosonNLP_sentiment_score.zip

python实现是利用jieba分词预测

Python

代码语言:txt
复制
import time import jieba emotion_dic = {} filename = 'BosonNLP_sentiment_score.txt' # txt文件和当前脚本在同一目录下,所以不用写具体路径 with open(filename, 'rb') as file: while True: try: senList = file.readline().decode('utf-8') # print(senList) senList = senList[:-1] senList = senList.split(' ') emotion_dic[senList[0]] = senList[1] except IndexError: break def get_emotion(score): emotion_archive = ['绝望,十分愤怒,对生活不在抱有希望', '难过,失望,抑郁', '有点小难过或者小愤怒', '轻微的难受或者不屑,想得太多啦,洗洗睡觉吧', '生活也就这样吧', '有点小开心或者小激动', '蛮开心的,生活多美好', '喜笑颜开,每天的太阳都是新的,生活充满了希望'] if score <= -3.9: return emotion_archive[0] elif -3.9 < score <= -2.5: return emotion_archive[1] elif -2.5 < score <= -1: return emotion_archive[2] elif -1 < score <= 0: return emotion_archive[3] elif 0

测试文本来自陈奕迅《爱情转移》中“才拒绝做爱情代罪的羔羊”

结果:

-0.730524151526 轻微的难受或者不屑,想得太多啦,洗洗睡觉吧

网站所有原创代码采用Apache 2.0授权 网站文章采用知识共享许可协议BY-NC-SA4.0授权

官方客服

LIKE.TG汇集全球营销软件&服务,助力出海企业营销增长。提供最新的“私域营销获客”“跨境电商”“全球客服”“金融支持”“web3”等一手资讯新闻。

点击【联系客服】 🎁 免费领 1G 住宅代理IP/proxy, 即刻体验 WhatsApp、LINE、Telegram、Twitter、ZALO、Instagram、signal等获客系统,社媒账号购买 & 粉丝引流自助服务或关注【LIKE.TG出海指南频道】【LIKE.TG生态链-全球资源互联社区】连接全球出海营销资源。


Banner广告
Banner广告
Banner广告
Banner广告
全球峰会
Server deployment