人工智能论坛

徐大大seo:谷歌SEO如何做外链
外链是指其他网站链接到你的网站,这是谷歌SEO中非常重要的一部分。外链数量和质量对于网站排名有着非常大的影响。那么,如何做好外链呢?1. 内容质量首先,要做好外链,必须要有高质量的内容。只有内容质量好,才能吸引其他网站链接到你的网站。因此,要注重网站内容的质量,提供有价值的信息和资源,让其他网站愿意链接到你的网站。2. 社交媒体社交媒体是获取外链的重要途径之一。通过在社交媒体上发布有价值的内容,吸引用户分享和转发,从而获得更多的外链。同时,社交媒体也是一个很好的宣传渠道,可以提高网站的知名度和曝光率。3. 友情链接友情链接是指与其他网站进行链接交换,这是获取外链的一种常见方式。但是,要注意友情链接的质量,选择与自己网站相关性高、质量好的网站进行链接交换,避免与低质量网站进行链接交换,影响网站排名。4. 媒体报道媒体报道是获取高质量外链的一种重要途径。通过与媒体合作,发布有价值的新闻和信息,可以吸引媒体报道,从而获得高质量的外链。但是,要注意新闻的真实性和可信度,避免发布虚假信息,影响网站信誉。5. 相关论坛参与相关论坛是获取外链的另一种途径。通过在相关论坛上发布有价值的内容,回答其他用户的问题,可以吸引其他网站链接到你的网站。但是,要注意论坛的质量和相关性,选择与自己网站相关性高、质量好的论坛进行参与。总之,外链是谷歌SEO中非常重要的一部分,要注重外链的数量和质量,选择合适的方式获取外链,提高网站的排名和曝光率。

第九期|不是吧,我在社交媒体的照片也会被网络爬虫?
顶象防御云业务安全情报中心监测到,某社交媒体平台遭遇持续性的恶意爬虫盗取。被批量盗取用户信息和原创内容,经分类梳理和初步加工后,被黑灰产转售给竞争对手或直接用于恶意营销。由此不仅给社交媒体平台的数字资产带来直接损失,影响用户对社交媒体平台的信任,更破坏了内容产业的健康发展。
社交媒体是重要的内容平台中国互联网络信息中心(CNNIC)第46次《中国互联网络发展状况统计报告》显示,截至2020年6月,微信朋友圈使用率为85.0%,QQ空间、微博使用率分别为41.6%、40.4%,较2020年3月分别下降6个百分点、2.1个百分点。微信朋友圈、微博等主流社交平台长期占据大部分流量,并通过不断丰富的短视频、电商、本地生活等服务,构建完善的流量闭环和服务生态。通过社交平台,网民和企事业组织积极分享图文视频信息,进行各类宣传推广,展示个体形象。例如,2022年北京冬奥会是迄今收视率最高的一届冬奥会,在全球社交媒体上吸引超20亿人关注。顶象防御云业务安全情报中心第BSI-2022-dpda号情报显示,有黑灰产团伙开发出专门的恶意网络爬虫软件,破解某社交媒体平台的通讯接口和算法,通过篡改IP地址等方式,绕过平台设置的安全防护措施,对该社交媒体进行高频的数据盗取。被盗取的数据包含社交媒体用户信息,以及用户原创的文章、图片、视频等内容。社交媒体平台的数据是企业的重要数字资产。作为新型的生产要素,不仅是企业核心的竞争力,更是新产品、服务、流程和管理的重要组成部分。恶意爬虫的爬取、盗用行为,不仅造成企业数字资产损失,带来直接的经济损失,消耗了平台服务和带宽资源,严重破坏内容产业的生态秩序。
恶意爬虫肆意盗取社交媒体原创内容机械工业出版社出版的《攻守道—企业数字业务安全风险与防范》一书中,认为恶意网络爬虫会带来数字资产损失、用户隐私泄露和扰乱业务正常运行等三大危害,并将“恶意网络爬虫”列为十大业务欺诈手段之一。网络爬虫,又被称为网页蜘蛛,网络机器人,是按照一定的规则,自动地抓取网络信息和数据的程序或者脚本。网络爬虫分为两类,一类是搜索引擎爬虫,为搜索引擎从广域网下载网页,便于搜索检索,后者则是在指定目标下载信息,用于存储或其他用途。另一类是恶意爬虫,是从公开或半公开网络平台抓取商品、服务、文字、图片、用户信息、评价、价格信息以及账户密码、联系方式、身份等隐私信息。顶象防御云业务安全情报中心分析发现,盗取某社交媒体的恶意爬虫共有两种:第一种恶意爬虫由开发编程能力的人员自主编写,能够根据需要和目的,对规则、逻辑进行自定义;第二种恶意爬虫是直接购买标准化的爬虫工具,简单易用上手快,同时搭售反爬工具。爬虫开发制作门槛比较低。很多技术论坛社区有关于爬虫开发、研究、使用介绍,市面上也有很多专业的爬虫书籍。只要掌握Python编程语言,按照论坛、社区和书籍上提供的爬虫教程和实操案例,同时根据爬虫技术爱好者分享出来的平台、网站、App的API接口信息,就能够快速搭建出一套专门的爬虫工具。同时,市面也有很多标准化的爬虫工具。这类工具提供了可视化的操作,不懂编程、没有开发能力也能够使用。只需要简单的配置,就能够对目标进行爬取。不仅爬取的进度和结果是可视化,结果导出也相当便利。并且,这类工具还会提供付费购买的工具,帮助使用者绕过常规的反爬措施。
黑灰产盗取社交媒体数据的目的黑灰产盗取数据是为了牟利。盗取社交平台的用户信息和原创内容后,黑灰产对数据进行储存、加工,然后行商业化售卖,甚至进行诈骗。顶象防御云业务安全情报中心分析发现,黑灰产盗取社交媒体数据主要是以下三个目的。第一类,为其他平台导流。有非常多针对社交媒体的数据分析平台。通过对社交平台d用户账号信息、内容、浏览、点赞等数据分类处理后,就可以进行内容分析、榜单排行、数据监控等提供服务,输出为三方舆情服务。或者,提取出用户的关注聚焦点,制作类似聚焦的内容,为其他平台做导流。第二类,搬运内容为其他账号吸引粉丝。粉丝是社交媒体账号影响力的重要体现之一。由于大多数账号自身创作能力有限,很多账号通过爬虫爬取他人的优质文章、视频,再将内容简单加工后重新发布到自己的账号,由此达到快速吸粉的目的。说白了,就是剽窃他人原创版权。第三类,制作仿冒账号进行诈骗。通过爬虫爬取社交平台他人的信息、分享的文章、视频等内容,在同个平台或在另一个社交平台建立高仿的虚假账号,骗取粉丝的关注,然后进行各类欺诈。此外,竞争对手也会利用网络爬虫进行恶性竞争。同行的竞争是赤裸裸的。不少公司会雇佣黑灰产,对目标平台发起数据盗取攻击,从而导致竞品无法正常使用。如果在某个重要的节点,通过恶意爬虫对目标平台进行大流量的访问或盗取,会瞬间过高的并发量,出现DDoS效果,导致大量普通用户无法正常访问该网站,干扰平台的正常运营。
恶意网络爬虫的技术特征机械工业出版社出版的《攻守道—企业数字业务安全风险与防范》一书中,对恶意网络爬虫有详细的技术特征分析,大体来看,主包含以下几点特征。1、访问的目标集中。恶意网络爬虫主要是爬取核心信息,因此只浏览访问多个页面,对于非涉及信息数据的页面不做不访问。2、行为有规律。由于爬虫是程序化操作,按照预先设定的流程进行访问等,因此呈现出有规律、有节奏且统一的特征。3、同一设备上有规模化的访问和操作。爬虫的目的是最短时间内抓取最多信息,因此同一设备会有大量离散的行为,包括访问、浏览、查询等。4、访问IP地址异常。爬虫的IP来源地址呈现不同维度上的聚集,而且浏览、查询等操作时不停变换IP地址。并且很多爬虫程序伪装成浏览器进行访问,并且通过购买或者租用的云服务、改造路由器、租用IP代理、频繁变更代理IP等进行访问。5、操作多集中非业务时间段。爬虫程序运行时间多集中在无人值守阶段。此时系统监控会放松,而且平台的带宽等资源占用少,爬虫密集的批量爬取不会对带宽、接口造成影响。
针对恶意网络爬虫的防控建议基于恶意网络爬虫的技术特征以及社交媒体平台的特点,顶象防御云业务安全情报中心安全及防控建议如下。1、安全防护建议加强平台风险环境监测。社交平台的客户端可集成安全SDK,使其定期对App的运行环境进行检测,对于存在代码注入、hook、模拟器、云手机、root、越狱等风险能够做到有效监控和拦截。保障客户端安全。社交分析平台的APP和网页,可以分别部署H5混淆防护及端安全加固,以保障客户端安全。保障通信传输安全。黑产在业务通信传输的环节,可能会尝试篡改、爬取报文数据。通过对通讯链路的加密,可防止终端安全检测模块的数据被篡改和冒用。加强业务安全策略防控。针对批量爬虫的风险特征,可将社交媒体中各个业务查询场景的请求接入业务安全风控系统。同时将终端采集的设备指纹信息、用户行为数据等传输给风控系统,通过在风控系统配置相应的安全防控策略,有效地对风险进行识别和拦截。1)设备终端环境检测。识别客户端(或浏览器)的设备指纹是否合法,是否存在注入、hook、模拟器等风险。通常批量作弊软件大多都存在以上风险特征。2)行为检测。基于设备行为进行策略布控。针对同设备高频查询,同IP高频查询,相同IP段反复高频查询的请求进行监控。3)名单库维护。统计基于风控历史数据,对于存在异常行为的账号、IP段进行标注,沉淀到相应的名单库。对于名单表内的数据在做策略时进行分层,适当加严管控。4)外部数据服务。考虑对接手机号风险评分、IP风险库、代理邮箱检测等数据服务,对于风险进行有效识别和拦截。2、处置及防控措施顶象防御云业务安全情报中心建议,对识别为风险的请求进行实时拦截,直接反馈查询失败等,或在发现异常后通过弹出验证码的方式要求进行人机识别。第五代智能验证码。验证码能够阻挡恶意爬虫盗用、盗取数据行为,防止个人信息、平台数据泄露。当某一设备或账户访问次数过多后,就自动让请求跳转到一个验证码页面,只有在输入正确的验证码之后才能继续访问网站。但是设置复杂的验证码会影响用户操作,带来负面的体验感受。设备指纹+风控引擎+智能模型平台。设备指纹及时识别注入、hook、模拟器等风险,风控引擎对注册、登录、领取等操作进行风险实时识别判定;智能模型平台帮助社交媒体构建专属风控模型,由此构建多维度防御体系,有效拦截各种恶意爬虫风险,且不影响正常用户体验

在帅帅哒小扎眼里,虚拟现实和社交媒体更配哦!
Facebook 创始人、首席执行官马克·扎克伯格很早就表现出对 VR 技术的兴趣。正是 Facebook 于 2014 年以 20 亿美元收购了虚拟现实设备制造商 Oculus VR,引发了整个科技圈对虚拟现实的关注。最近,Facebook 发布消息称其将在三星 Gear VR 头显上应用 360 度视频流媒体技术。小扎表示,VR 将是下一个平台,在这里任何人可以体验任何他们想要的事物,人们将逐渐意识到 VR 将是一个重要的手段和工具。VR 到底将成为什么重要的手段和工具?在小扎眼里,虚拟现实和社交媒体结合便是这个市场的未来。作为一家拥有创新精神的互联网公司,Facebook 总是有众多超前的好点子,所以小编对此深信不疑。此外,智能手机巨头 HTC 也于近日对此做出了呼应,表示将和 Facebook 、Oculus 以及其他团队紧密合作,在所有平台上为未来的社交 VR 体验创造奠基石。Facebook 希望他们的工作可以创造价格低廉的网络基础设施设备,这样一来在目前不能承受互联网费用的地区扩大网络使用就更加合算。目前,Facebook 致力于用其“新社交 VR 团队”的创造来不断地发展奠基社交 VR 的长远未来。小扎表示,“未来无论身处世界何地,在任何时间,人们都可以相互集体聚会。我们在 VR 上就关注这两样东西。”想象一下你随时都可以坐在篝火前,和朋友一起玩耍的情景。你是不是对这一天的到来充满期待呢?如果答案是肯定的,一起持续关注新社交 VR 团队吧。

社交媒体和arXiv存在,让双盲评审形同虚设 | Reddit热议
白交 发自 凹非寺
量子位 报道 | 公众号 QbitAI双盲评审机制真的双盲吗?最近,Reddit上有这样一个讨论:社交媒体与arXiv是否损坏了顶会双盲的机制?13个小时,热度超过300…起因是一位研究人员分享了他的经历:NeurIPS 2020会议提交截止之后,他在Twitter上看到有人分享他们的arXiv研究成果,并得到了很好的反馈。关键是,这些人一般都是Twitter上的大V,大多都来自谷歌、Facebook等著名机构的研究人员。一旦发出,就会一呼百应,受到大家的点赞和转发。比如,就像这位Facebook AI研究员。甚至还有一些机构直接下场发推——DeepMind的新研究,自监督模型BYOL刷新ImageNet记录。而此时,这些大会的评审工作还没有完全结束。这样做不仅会给双盲评审人员巨大压力,还损坏了顶会双盲评审机制。还没有通过同行评审就放arXiv和社交媒体上,那双盲岂不是在搞笑?影响力or接收,哪个更重要?先不论双盲机制是否真的双盲。对于一个研究团队而言,每年顶会放榜,论文会被录用?录用几篇?都是他们关注的问题。毕竟这意味着你们这个团队在领域有多大的影响力,还有利于之后的研究进行。就像这位来自小型研究室的成员说的那样,几年前在ML和CV领域的认可度几乎为0,而被这些大会接收以后,原本毫不起眼的实验室也就有了一定的影响力。这样来看,影响力与论文接收其实并不冲突。但是对于一些团队而言,却有一个谁在前在后的问题,尤其是对于那些已经在领域内有一定影响力的人。被更多人认可、讨论、运用似乎就比被一个会议接收来的更重要。就像这位网友提到的那样:现实情况是,社交媒体上宣传对一篇论文的成功,远比是否被会议接收更重要。
等到会议真正放榜的时候,大部分的论文已经过时不受关注了。它只是为了让你的简历更加好看。但是对于一般的团队而言,是否要提前发布在arXiv,甚至发表在社交媒体上呢?
有的人作为一个旁观者的角度,认为自己从arXiv了解到很多棒的idea,当一篇论文还在审核的时候,就已经读过了,而最终是否会被会议录用,与我们毫无关系。这样来看,arXiv确实能够提供了更为广泛的交流机会。但是林子大了,什么样的论文也就有了,arXiv论文鱼龙混杂也不是一天两天的事情了。那么对于一些没那么大影响力的团队而言,担心自己的idea被人窃取,也估计收不到那么多的关注,也就不会提前在arXiv上发表,更别说在Twitter上发表了。同行评审也一直饱受争议而落回会议的同行评审制,其实也一直饱受争议。最关键的原因,就在于它的不透明性。如何审?有多少人审?这些审稿人的身份是什么?仅仅因为少数人甚至可能只有3-4人的评审观点,就能判断这个论文的好坏?GAN的发明人,现为苹果AI负责人Ian Goodfellow 就曾炮轰同行评审机制,认为是这一制度导致了如今AI会议论文下降。其中,「评审人质量参差不齐」是主要原因,浮夸的论文被选中,真正的好论文反而被埋没。那么如何解决这个问题呢?既然如此,arXiv和社交媒体会一直存在,审稿也会继续,那么该如何解决这个问题呢?此前,就曾有过一个会议解决这个问题,KDD 、ACL就曾要求,在论文结果出炉之前不允许发表在arXiv上。在这里,有一些网友提供了自己的建议:arXiv可以为正在审阅的论文添加匿名模式,发布的同时不会透露其身份。修改会议规则,取消可以通过合理方式(比如,互联网搜索)识别作者的论文的资格。而如果在审稿途中,已经知晓了论文作者是谁,该如何做呢?有这样一个建议:启动一个关于论文的Reddit线程,或者问问朋友们对论文的arxiv版本有什么看法。
如果你已经在Twitter上知道了论文作者,那么为何不更进一步,利用Twitter寻找论文的缺陷—这反而还会抵消知道作者很有名的偏见。 你觉得呢?有什么更好的建议吗?欢迎与我们分享~
参考链接:
https://www.reddit.com/r/MachineLearning/comments/hbzd5o/d_on_the_public_advertising_of_neurips/
作者系网易新闻·网易号“各有态度”签约作者

AI框架解释你的社交媒体订阅,提高透明度和可解释性
编辑 | bie管我叫啥
发布 | ATYUN订阅号Feed是现代音乐推荐,新闻聚合器和社交媒体平台的基石。如果你像大多数人一样,你每天会花几分钟到几个小时滚动浏览歌曲,剪辑,文章,以及根据你的兴趣和偏好做出的广告。但是,如果支持Feed的算法(及其建议)更加透明就更好了。
分析交互图马克斯普朗克信息学研究所的研究人员研究了一个框架——活动项目关系发现框架FAIRY,用于系统地发现、排列并解释用户行为与社交媒体提要中出现的内容之间的联系。论文的合著者写道,透明度和可解释性是现代社会认知超载、过滤气泡、用户跟踪和隐私风险的关键问题,feed源于一个人的兴趣,友谊网络,在平台上的行为以及外部趋势的复杂组合。随着时间的推移,用户积累了数千个共同构成个人资料的行为(帖子,赞成,喜欢,评论等),使用户无法记住所有这些细节。FAIRY试图通过使用用户可见的信息创建用户特定的交互图来解决这一难题。它从真实的社交媒体平台数据中学习预测相关性与出乎意料的模型,然后利用学习到的排名技术来揭示和排名图表中的关系。引导FAIRY的功能分为五组:用户,类别,项目,路径实例和路径模式,其中“路径”指的是解释路径。用户的影响力(例如,跟随者与被跟随者的比率)被衡量为对其活动的补充,以及他们与各种feed项目的接触。研究人员指出,由于典型人员进行的feed交互量很大,因此图表实体关系的范围从数千到数百万。前面提到的学习排名方法通过仅向用户呈现相关(通常用作令人满意的解释)或出乎意料(被遗忘的或未知的关系)的前几个连接使得它们更容易解析。训练与测试在研究中,科学家们委托20名志愿者与两个平台进行互动,Quora和Last.fm,并使用新账户,每个账户有5个粉丝。在几个会话过程中,他们至少在两个服务中的一个上花费了20个小时,执行至少12个活动,同时在滚动整个feed后找出并非显而易见的项目。在每次会话之后,团队更新交互图并在挖掘feed项的解释路径之前,为每个用户选择三个并非显而易见的建议。在一系列测试中,研究人员发现,FAIRY在预测用户认为相关和令人惊讶的解释的任务方面优于三个关系挖掘基线。他们将其成功归功于用户影响范围和学习到排名方法的强大信息网络表示,并且他们认为该工作是朝着提高社交媒体feed透明度目标迈出的第一步。在未来,该团队计划将FAIRY作为浏览器插件实施,并进一步调查用户在多个平台上的活动效果。论文:arxiv.org/pdf/1908.03109.pdfEnd

社交媒体的神操作:如何在互联网上删去一段历史?
By 超神经场景描述:在信息资讯爆炸的今天,人们关注的焦点和记忆,在算法的应用下,弊端和优点都十分鲜明,那么我们在数据信息中,主动或者被动的记住还是忘记,又是如何被影响的呢?关键词:集体失忆 推荐算法 网络屏蔽在科幻作品中,经常出现使用工具或者咒语,使人消除近期的记忆。被消除记忆的人,通常是因为看到了不该看的,或者是忘掉想忘掉的。在现实中,还没有这样的工具,重要的历史都会被同时代的人,记录成为各种形式。数据作为新的信息载体,也极大的改变了人们的观念体系。无数新的热点,逐渐覆盖我们的记忆,在新闻热点的影响下,我们不断被动刷新认知。热点越多,越侵占我们的记忆空间。如果不被反复强调,时间长了,有些热点,就像是没有发生过一样。一段小故事:极端观念的形成在 2014 年前后,正是 ISIS 崛起的那几年,也正是社交媒体、移动互联网信息爆炸的时期。虽然他们倡导的主张极端保守,但 ISIS 却使用丰富的传播手段,比如推特、脸书和油管这些工具,来宣传极端思想,以此吸引全世界各地的支持者加入他们。其中脸书和推特都是 ISIS 的重灾区他们甚至还知道如何打造自己的人设,除了发布残暴的刑罚视频,他们还会充分讨好年轻网友。甚至打造了一个「圣战猫咪 Islamic State Cats」的账号,专门发布他们生活中的小猫照片和视频,直到这些账号,被推特和脸书一一关闭。封号前,这曾是 ISIS 在推特上最受欢迎的账号之一在 2018 年第一季度,Facebook 一共删除了 2888.37 万条帖子,同时关闭和删除了大约 5.83 亿个虚假账户,这一块主要是指恐怖主义,和仇恨言论的相关信息和账户。巨头的权力:悄悄抹去不和谐的痕迹Facebook 表示,在屏蔽和删除帖子的过程中,已经越来越少的依赖人力,目前 99.5 % 与恐怖主义相关的帖子,是由 Facebook 通过人工智能的技术手段找到的。
其中一种技术就是图像识别与匹配,一旦用户发布的图片疑似涉嫌,Facebook 会通过算法实现自动匹配,找出图片是否和 ISIS 的宣传视频有关,或者能否和已删除的极端图片或视频相关联,进而采取封禁措施。Facebook 的技术团队曾在博客《Rosetta: Understanding text in images and videos with machine learning》中,描述了图像识别工具 Rosetta 是如何运行的。图像识别工具 Rosetta 为识别阿拉伯语做了特殊处理Rosetta 使用 Faster R-CNN 检测字符,再通过CTC(Connectionist Temporal Classification)损失的 ResNet-18 完全卷积模型,来进行文字识别,并用 LSTM 增强准确性。最终生成的文本识别模型结构此外,Facebook 还进行着文本分析研究,对网站上恐怖分子可能使用的语言进行解析,一旦发布的内容涉及恐怖主义,立刻就会做出相应的对策。除了日益强大了的 AI 审核工具,Facebook 也有强大的人工审核团队,他们的安全团队分为社区运营和社区诚信两支队伍。社区诚信团队主要负责建立举报-反应机制的自动化工具。目前,这支人工审查团队已经达到两万多人,以 Facebook 目前二十亿活跃用户来算,每名安全人员需覆盖十万用户。直播网红:即使平台不干涉,最多火半年资料显示,目前国内映客、花椒、一直播、美拍、陌陌、火山六大娱乐直播平台的有效主播人数约为 144 万,如果加上游戏直播平台的斗鱼、虎牙、企鹅电竞和熊猫TV,国内知名直播平台的有效主播总数大致应在 240 万~250 万人。在这些想要快速成名的年轻人中,很多人并不具备成为偶像的条件。于是,他们就另辟蹊径,通过整容、恶搞、极端表演来吸引用户的眼球。有主播表演生吃动物、喝辣椒油,甚至有主播进行铁轨上拍照、高速上停车、攀爬高楼、高台跳水,各种高度危险的行为,一度发生了多次主播因拍摄视频造成严重伤亡的事件。经历了发展之初那段上无监管、下无门槛的混乱时期后,国家监管部门迅速介入行业规则确立,各类法律法规陆续出台,专项整治行动此起彼伏,各个平台也开始打击各种内容违规的主播。快手的 CEO 宿华在对媒体的访问中提到,快手的推荐算法并不是简单地打标签,而是交互影响,比如「有这么几个人都共同喜欢同样一个人,我们就会认为这些人具备了相同的某个特征。」正是给予这些特征,算法能够预估内容与用户之间匹配的程度。在推荐系统中,最为常用的就是协同过滤算法 Collaborative filtering,简单来说,这个算法主要的功能是预测和推荐。基于协同过滤算法的推荐系统原理示意
算法通过对用户历史行为数据的挖掘发现用户的偏好,构建用户画像或者内容画像,基于不同的偏好对用户进行群组划分来向用户推荐可能感兴趣的内容。第一类是 Neighborhood-based,第二类是 Model-based approach,在这种方法中,模型使用不同的数据挖掘,机器学习算法来预测用户对未评估内容的评分。
协同过滤算法(用户推荐系统)分类大多数商业应用也都是混合型的,也通过多种推荐算法重叠,弥补不同算法的缺陷,使推荐结果更加精准。
现在,我们很难再看到极端低俗的视频内容,也更不会看到他们因为观众的热捧被顶上首页。但这并不证明这些视频没有被拍摄,或者说这些视频内容没有在真实世界发生。集体失忆:你看到的都是Ta想让你看到的我们所接触的各种资讯,都是通过层层筛过的算法之后,所构建起来的一种景象,但它究竟会不会是一个「楚门的世界」,恐怕也很难说清楚。
何况在这个世界上,来自于不同的政府、组织、民族、文化的力量都在干预着信息的呈现,这个世界的真相,从来都不会是随便一刷手机,不动脑子就能明白的。不断被干预的记忆背后,是掌控我们社交渠道的大公司,只要他们想,就可以轻而易举的控制舆论,让民众很快忽略、忘记一些事情。拥有越来越多智能工具,并不能是我们惰于思考的借口。相反,我们所需要的是在技术的加持下,更努力去探究世界的真相。

用JAVA的DEA算法衡量社交媒体页面的流行度
Measuring the Social Media Popularity of Pages with DEA in JAVA原文作者:Vasilis Vryniotis原文地址:http://blog.datumbox.com/measuring-the-social-media-popularity-of-pages-with-dea-in-java/译者微博:@从流域到海域译者博客:blog.csdn.net/solo95用JAVA的DEA算法衡量社交媒体页面的流行度在前面的文章中,我们讨论了数据包络分析(Data Envelopment Analysis)技术,我们已经看到它如何被用作一个有效的非参数排序算法。在这篇博文中,我们将开发出一个JAVA数据包络分析的实例,我们将用它来评估网络上的网页和文章的社交媒体流行度。该代码是开源的(在GPL v3 license下),您可以从Github免费下载。更新:Datumbox机器学习框架现在是开源的,可以免费下载。查看包com.datumbox.framework.algorithms.dea以查看Java中Data Envelopment Analysis的实现。数据包络分析在JAVA中的实现代码是用JAVA编写的,可以直接从Github下载。它是根据GPLv3许可的,所以可以随意使用它,修改它,或者再分发。该代码实现了数据包络分析(Data Envelopment Analysis)算法,使用lp_solve库来解决线性规划问题,并使用Web搜索引擎优化分析(Web SEO Analytics )索引提取的数据,以构建基于Facebook,Google Plus和推特上分享的一个混合的社交媒体页面流行度矩阵。在前面的文章中介绍了算法的所有理论部分,在源代码中可以找到关于其实现的详细的javadoc注释。(原博文之后数据包络分析(Data Envelopment Analysis)算法及其实现全部简称了DEA,请读者注意,译者注。)下面我们提供一个关于其架构实现的高级别描述:1. lp_solve 5.5 library为了解决各种线性规划问题,我们使用一个名为lp\_solve的开源库。某些特定的lib是用ANSI C编写的,并使用JAVA包装来调用库方法。因此,在运行代码之前,您必须在您的系统上安装lp_solve。该库的二进制文件在[Linux和Windows都可以使用,您可以在lp_solve文档中阅读更多有关安装的信息。在尝试运行JAVA代码之前,请确保您的系统上安装了(相关的)特定库。有关安装和配置库的任何问题,请参阅lp_solve文档。2.DataEnvelopmentAnalysis Class这是DEA算法的主要实现类。它实现了一个名为estimateEfficiency()的公共方法,它获取记录的Map并返回它们的DEA得分。3. DeaRecord ObjectDeaRecord是一个特殊的对象,用于存储我们记录的数据。由于DEA需要分离输入和输出,因此DeaRecord对象将以DEA可以处理的方式分别存储我们的数据。4. SocialMediaPopularity ClassSocialMediaPopularity是一个应用程序,它使用DEA来评估社交媒体网络上Facebook的like,Google的 +1和twitter的Tweets的网页流行度。它实现了两个受保护的方法:calculatePopularity()和estimatePercentiles()以及两个公共方法loadFile()和getPopularity()。calculatePopularity()使用DEA实现根据社交媒体计数来估计页面的得分数。estimatedPercentiles()方法获取DEA分数并将其转换为百分位数。总的来说,百分比比DEA分数更容易解释; 因此当我们说一个网页的流行分数是70%时,这意味着该网页比70%的其他网页更受欢迎。为了能够估计一个特定页面的流行度,我们必须有一个包含其他页面的社交媒体数据的数据集。这是有原因的,因为需要预测哪个网页是受欢迎的,哪些不是,您必须能够将其与网络上的其他页面进行比较。为此,我们使用来自以txt格式提供的Web SEO分析索引的小型的匿名样本。您可以通过从网页上的更多页面提取社交媒体计数来构建自己的数据库。(社交媒体计数,比如点赞数、转发数、评论数)loadFile()方法用于加载DEA的上述统计信息,getPopularity()方法是一种易于使用的方法,可以获取Facebook的like,Google的+1和一个页面的Tweets数量,并以此评估其在社交媒体上的流行度。如何使用数据包络分析的JAVA实现在DataEnvelopmentAnalysisExample类中,我提供了2个不同的关于如何使用代码的例子。第一个例子直接使用DEA方法来根据它们的输出(ISSUES,RECEIPTS,REQS)和输入(STOCK,WAGES)来评估组织单位的效率。这个例子来自DEAzone.com的一篇文章。代码语言:txt复制Map<String, DeaRecord> records = new LinkedHashMap<>();
records.put("Depot1", new DeaRecord(new double[]{40.0,55.0,30.0}, new double[]{3.0,5.0}));
//...adding more records here...
DataEnvelopmentAnalysis dea = new DataEnvelopmentAnalysis();
Map<String, Double> results = dea.estimateEfficiency(records);
System.out.println((new TreeMap<>(results)).toString());第二个示例使用我们的社交媒体流行度应用程序,通过使用来自社交媒体的数据来评估页面的流行度,例如Facebook的like,Google的+1和Tweets。所有的社交媒体计数都被标记为输出,我们传递给DEA一个空的输入向量。代码语言:txt复制SocialMediaPopularity rank = new SocialMediaPopularity();
rank.loadFile(DataEnvelopmentAnalysisExample.class.getResource("/datasets/socialcounts.txt"));
Double popularity = rank.getPopularity(135, 337, 9079); //Facebook likes, Google +1s, Tweets
System.out.println("Page Social Media Popularity: "+popularity.toString());必要的扩展(上面)所提供的代码只是DEA如何被用作排名算法的一个例子。为了改进其实现,需要进行下面的扩展:1.加速(算法的)实现特定的DEA算法实现会评估数据库中所有记录的DEA得分。由于我们需要解决如同数据库中记录数量那样多的线性规划问题,这使得实现变得缓慢。如果我们不需要计算所有记录的分数,那么我们可以显著地加快执行速度。因此,该算法的小扩展可以使我们更好地控制哪些记录应该被解决掉,哪些只能被用作约束。2.扩大社交媒体统计数据库(这篇文章所)提供的社交媒体统计数据库由来自Web SEO Analytics索引的1111个样本组成。为了能够估计更准确的流行(度)分数,需要更大的样本。您可以通过统计来自网络上更多页面的社交媒体计数来创建自己的数据库。3.添加更多的社交媒体网络该实现使用Facebook的喜欢,Google的+1和推文的数量来评估文章的受欢迎程度。不过,来自其他社交媒体网络的指标可以很容易地被考虑在内。您只需要从您感兴趣的网络中构建一个社交媒体数据库,然后扩展SocialMediaPopularity类来处理它们。关于实施的最终意见为了能够扩展(算法的)实现,您必须对Data Envelopment Analysis的工作原理有一个很好的理解。这在前面的文章中已经介绍过了,所以在继续进行任何更改之前,请确保您阅读了之前的教程。此外,为了使用JAVA代码,您必须在您的系统中安装lp\_solve库(参见上文)。如果你在一个有趣的项目中使用这个实现,那么就给我们一条线索,我们将在我们的博客上展示你的项目。另外,如果你喜欢这篇文章,请花点时间在Twitter或Facebook分享。

xiao77论坛php,论坛
大家好,又见面了,我是你们的朋友全栈君。论坛1. 如何加其他人为好友?ID头像下方有“加好友”、“发消息”、“打招呼”和“串个门”的互动功能。在发帖的头像区和该人的个人资料区都可以进行互动,且有不同的奖励。 2.看到喜欢的帖子如何保存?可点击帖子下方的“收藏”按钮,然后回到个人空间的收藏应用中查看即可。 3.如何查看所有我参与过的帖子?登录成功后,在页面右上角点击“帖子”即可查看。 4.如何知道我参与的帖子有了新的回复?当有人回复了你的帖子,跟你打招呼、留言、站短的时候,在登录名的右上角会有提醒。 5.如何发帖及传图?1.论坛左上角是发帖入口2.发帖必须选择[分类主题],不然无法发布。3.上传图片:A.点击上图中的传图键B.选择[批量上传]点击浏览,选择你电脑里的图片,可以多选,然后点击[上传]。上传之后会显示图片列表,你就把图片插入你想编辑的位置,点击一下该图片就可以了。C.待图片全部插入之后,关闭图片上传框就OK啦!如果插入的是图片的网络地址,你可以再[网络图片]处进行操作。 6.拼单专区是干什么的?如何发起拼单和参加拼单?拼单专区是会员自由发起团购的地方,拼单专区的宗旨是通过拼单凑量的形式争取到各优惠的价格。如果您有好的拼单货源可以通过发表新帖的方式发起拼单,如果您要参加某一个产品的拼单也可以在该帖内跟帖。为了避免广告的嫌疑,拼单专区不允许出现任何网站地址连接。7.如何在网站转让我的二手闲置?Onlylady网站有专门的“跳蚤市场”,专供会员交易二手闲置。注:跳蚤市场只可转让国家法律法规所允许的二手物品。8.想和大家分享我的视频,该如何操作?Onlylady网站没有专门的视频论坛,您你可以把您在别处发布的视频用代码形式转帖在论坛里的相应版块,这样就能和onlylady的广告会员分享你的视频了发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/125337.html原文链接:https://javaforall.cn

突破传统营销:SEO、社交媒体和聊天机器人的联动策略
搜索引擎优化(SEO)、社交媒体和聊天机器人之间的界限越来越模糊,这为您创造了与受众建立联系和推动参与的新机会。如果您对聊天机器人技术有些疑虑,那就让我们来看看这些令人兴奋的新可能性能否让您安心!让我们来了解搜索引擎优化、社交媒体和聊天机器人的交叉点,并概述一些在数字营销中利用它们的综合优势的策略。桥接SEO和社交媒体搜索引擎优化是我们提高搜索知名度的方式,而社交媒体是每个成功的数字营销策略的重要组成部分。两者可能会感到脱节,使跨平台参与成为一项挑战。这就是聊天机器人可以派上用场的地方。人工智能驱动的工具可以模拟人与人之间的对话,整合到你的社交媒体中,可以弥合你的SEO和社交媒体策略之间的差距。聊天机器人根据用户行为、查询和偏好提供对相关内容的即时访问,使他们更容易找到所需的内容。 这种深入、即时的互动可以提高内容在两个平台上的可见度和可发现性。增强跨平台的用户体验优化用户体验 (UX) 对于搜索引擎优化、社交媒体和聊天机器人交互的参与度和满意度至关重要。聊天机器人可以当场回答用户问题,帮助用户了解您的品牌目标,并引导他们在您的社交媒体页面或网站上找到他们需要的东西。跨平台的无缝和一致的体验意味着创建一个有凝聚力的生态系统,让用户的体验更加满意。跨渠道内容跨渠道的内容分发方法对于提高知名度和影响力也至关重要。这意味着利用搜索引擎优化和社交媒体来发布原创内容并增加流量。使用跨渠道方法可以确保您的内容覆盖尽可能广泛的受众,并不断为您的品牌吸引新用户。利用社交聆听获得 SEO 洞察力社交聆听是一门监测社交媒体渠道反馈的学科,包括正面和负面的反馈。社交媒体监听工具可以帮助您直观地了解用户在社交媒体平台上的对话和反馈,为您的搜索引擎优化和内容策略提供有价值的见解。以下是一些利用社交聆听来改善 SEO 的主要方法:确定话题和趋势户对话和反馈,您可以确定热门话题或行业趋势,进而为您的关键词和内容创建提供参考。紧跟这些趋势并将其融入到内容中,可以提高搜索引擎优化和目标受众对您的关注度。洞察用户需求社交监听数据可以提供有关用户偏好和需求的宝贵见解,让您可以调整和定制内容与聊天机器人的互动。了解用户谈论和关心的内容可以帮助您创建能引起共鸣的内容和满足用户需求的聊天机器人互动。监控用户反馈社交监听工具还能帮助您监控社交媒体平台上的用户反馈,让您找出能促进积极品牌声誉和推动参与的回应。您可以模仿这些用户的推理,将他们的反馈融入您的内容和聊天机器人互动中,从而提高搜索引擎优化和品牌声誉。通过整合聊天机器人扩大影响力将聊天机器人整合到您的社交媒体战略中可以改变内容扩增的游戏规则。您可以使用聊天机器人根据用户的偏好、行为和参与历史记录锁定目标用户,这样就能显著扩大内容覆盖范围,提高参与度和转化率。以下是一些可行的策略:促进社交分享鼓励用户在他们的网络中分享您的内容可以进一步扩大您的影响力。聊天机器人可以促使用户在他们的社交媒体上分享您的内容,从而迅速传播您的品牌。衡量成功和投资回报率衡量任何战略的成果对于持续改进和发展都至关重要。准确跟踪参与度指标、用户满意度和转化率可以确定需要改进的地方,并优化您的流程。以下是衡量综合战略成功与否时需要考虑的几个关键绩效指标(KPI)。用户参与度用户在您的网站、社交渠道和聊天机器人互动中的参与度对于评估策略的有效性至关重要。 需要考虑的指标包括对话时长、参与时间和回复率。这些指标将帮助您确定哪些渠道和策略最能吸引受众并促进转化。用户满意度评估用户满意度是新综合战略的另一个重要指标。反馈、评分和评论都是收集用户满意度量化数据的有用工具。对用户对话的定性分析可以提供其他有关用户情感和满意度的见解。通过将两者结合起来,就能了解用户对您的战略的满意程度。您可以找出需要改进的地方,并优化您的方法,以更好地满足他们的需求。转化率和投资回报率最终,您应该从转化率和投资回报率(ROI)的角度来衡量您的综合战略是否成功,因此您需要将时事通讯注册、产品购买和/或潜在客户生成等指标纳入其中。通过跟踪和分析综合战略对转化率的影响,您可以根据数据做出决策,决定在哪些方面分配资源,以及如何优化您的方法。最后整合搜索引擎优化、社交媒体和聊天机器人是提高参与度、增加知名度和促进转化的有力工具。您可以在各个平台上提供无缝、一致的用户体验,让他们更容易找到所需的内容并与您的品牌互动。因此,随时了解行业变化、衡量成功与否、促进跨团队协调与合作至关重要。

从云VR、VR直播、VR流媒体、VR社交,看5G+VR表现如何?
5G+VR说了这么久,到底应该怎么用?正文共 3401 字 13 图;预计阅读时间 9 分钟 自5G商用牌照正式落地后,5G已成2019年科技行业发展之热点。智能家居、物联网、车联网均趁5G浪潮而起,5G+VR亦被推至风口,部分人将2019年再次被称为“VR元年”。但一提及5G+VR的具体应用,许多人就显得有些模糊。5G将如何应用于VR?小编认为,5G于VR上的应用有这四方面:云VR、VR直播、VR流媒体、VR社交。今日,小编就从这四个方面分析5G+VR具体的应用场景。5G+云VR:突破硬件壁垒,实现广泛普及VR技术的出现为人类科技的发展提供了全新的可能。其对现实逼真的模拟,感官上震撼的体验将会在娱乐、培训、教育以及医疗等众多行业有着广泛的应用。但另一方面,VR技术在硬件方面存在的诸多问题,一定程度上限制了当前VR产业的发展。
VR硬件目前有何问题?那么VR硬件设备当前存在哪些问题呢?小编总结下来,有以下两点。一、硬件成本过高。当前,市面上主流的VR头显集中于HTC、Oculus、Sony以及Valve等行业头部厂商,这些公司旗下头显产品价格并不便宜。如今年Valve推出的Index头显,售价高达1000美元;而相对亲民一些的Oculus Rift S/Oculus,售价也高达399美元。这样高昂的成本,足以让大多数消费者望而却步。Valve Index
二、设备体验不佳。目前,一套完整的PC VR头显包括头显、定位器、计算主机、控制器等一系列设备。这些设备不仅需要进行复杂的组装,而且还带来了线缆的束缚。而较为轻便的VR一体机,往往在体验上无法与PC VR头显相比。如Oculus 近期推出的一体机头显Quest,虽然在体验和便携上取得了一定的平衡,但仍无法撼动硬件市场的整体状况。5G赋能云VR,体积、成本双“减负” 云VR能够将云计算、云渲染的理念和技术引入至具体的VR应用中,借助高速稳定的5G网络,将云端的显示输出和声音输出等经过编码压缩后传输到用户的终端设备,从而实现用户侧设备的轻量化和低成本化,一定程度上改善VR硬件当前存在的两个问题。因此,随着5G时代的来临,云VR的确有着广泛的应用前景。其云端计算带来的轻量化和低成本化优势,或许能拓展当前VR产业的市场,实现更广泛的普及。5G+VR直播:全民普及尚有难度,大型直播将成主流5G加持之下,云VR或许能实现广泛普及,那VR直播又如何呢?
VR直播现状首先,小编将从三方面分析VR直播面临的状况。一、硬件方面。首先,VR直播的观看需要头显的支持,当前VR头显较低的普及率,一定程度上就限制了VR直播的发展。而在直播本身方面,VR直播所需的拍摄成本较传统直播高出许多。如今,一名主播只需要一部智能手机或是一台电脑,就能开始正常的直播。但VR直播却需要投入在专业设备、专业拍摄人员、技术调试上,大量的资金和人力成本。二、应用场景。VR直播可以投入的应用场景十分广阔,包括教学培训、医疗直播、大型活动直播等多个领域。其中,大型活动的直播最具发展潜力。诸如演唱会直播、体育赛事直播之类的大型活动对“临场感”方面有着更多的要求,而VR直播恰好能够满足这一点。NBA VR直播
三、网络方面。与传统直播相比,VR直播在带宽和延迟上要求更高。VR直播所需的全景视频实时数据,远比传统直播上传的视频数据高出许多。此外,目前传统直播最高能达到4K的清晰度,但VR直播为了保证舒适的体验,清晰度理论上应该达到8K。5G赋能VR直播,官方平台将成主力面对VR直播当前的状况,5G能发挥什么样的作用呢?首先,5G网络带来的高带宽和低延迟,能够一定程度上能解决VR直播在网络方面的问题。其次,在硬件方面,5G加持下的云VR也能改善VR头显的普及问题。但在拍摄上的成本,5G网络恐难发挥作用,因此VR直播或许很难一开始就像传统直播一样演变成全民直播的局面。再联系上述提及的应用场景,小编认为:在5G的加持下,VR直播同样有着巨大的前景。但与云VR带来的大规模普及不同,VR直播将集中在政府以及直播平台等官方平台手中,在大型活动直播和一些行业具体应用上发挥作用。5G+VR流媒体:内容加持下的蓬勃发展那么VR流媒体又如何呢?小编认为,VR流媒体当前的状况与VR直播有些类似,但具体细节上有所不同。VR流媒体发展的现状一、网络方面。与VR直播类似,VR流媒体需要即时从云端下载视频数据。为了保证观影的流畅与较高的清晰度,VR流媒体同样需要高带宽以及低延迟的网络支持。二、内容方面。与VR直播不同,VR流媒体服务更依赖内容平台的支持。当前VR流媒体领域已经有许多内容平台入局。其中,一部分来自于老牌的传统流媒体平台,例如美国环球公司与福克斯旗下的Hulu,当前较为热门的Netflix,以及谷歌旗下的YouTube;另一部分则是Visbit、NextVR这样专门的VR流媒体服务商。这些内容平台,能够给VR流媒体提供优质的内容服务。 Hulu VR
三、硬件方面。在用户方面,VR流媒体同样需要VR头显的支持。但在内容上,VR流媒体当前主要依靠内容平台的支持,内容制作的硬件和技术条件更多是内容服务商考虑的事情。此外,VR流媒体在即时下载方面有着一定的要求,即时上传上要求不高。因此,在硬件设施方面,也没有VR直播那样高的要求。5G赋能VR流媒体,实现全面应用对于VR流媒体来说,网络的问题和VR头显的普及率,5G都能在一定程度上有所改善。而更为关键的内容方面,则有一系列老牌流媒体和专业VR流媒体厂商的支持,从而提供丰富的内容。这也是VR流媒体与VR直播最大的区别所在。因此,5G来临之后,随着云VR带来的设备普及,VR流媒体或许也能顺应潮流,迅速发展。5G+VR社交:技术层面尚未成熟前面提及的云VR、VR直播、VR流媒体在5G的加持下,或多或少都有着一定的发展前景。但VR社交或许并非如此。
VR社交发展的现状一、技术方面。在VRPinea此前的稿件还未脱离技术驱动阶段的VR社交,其应用与硬件究竟“是敌是友”?中,我们已经对VR社交的发展现状进行了一定的分析。当前,面部捕捉技术、动作追踪技术尚未成熟,VR社交还处于技术驱动阶段,并不能成为一个真正的社交产品。VR社交应用vTime
二、安全方面。这主要体现在两个方面,一个是个人隐私数据的安全问题,这也是网络安全中难以回避的问题;另一个则是VR空间中的骚扰行为,相较于现实空间,VR空间中的骚扰行为成本更低。5G赋能VR社交?现阶段或难实现对于VR社交而言,5G带来的高质量网络,的确能为需要网络支持的VR社交带来一定助力,但并非现在。VR社交当前发展面临的问题,主要还处于技术层面。在未来的2-3年期间,VR社交可能还难以成为一个真正的社交产品,而5G网络对VR社交的助力暂时还无法体现。因此,就现阶段来看,5G似乎并不能为VR社交的发展带来显著的影响。总体来说,5G+VR的确大有可为,这主要体现在云VR、VR直播、VR流媒体等三个方面,VR社交或许还要再等等。此外,虽然5G牌照正式落地,但5G网络的基础建设还需要一段时间的积累。看似5G+VR的具体应用已在眼前,但真正进入普通人的生活,或许还需一段时间。本文属VRPinea原创稿件,转载请洽:[email protected]

Salesforce发布可分析社交媒体内容的人工智能工具
就在CrimsonHexagon推出一项采用人工智能分析发布在社交网络上的媒体内容一周时间后,另外一个重要参与者也加入其中。Salesforce.com今天推出了一款名为Eistein Vision for Social Studio的工具,可以让Salesforce营销平台的用户追踪消费者在线分享的图片。这个工具是由一个计算机视觉服务提供支撑的,Salesforce在今年年初发布该服务,主要面向用用开发者。目前人工智能在解析视觉信息方面还远远落后于人类,但是社交媒体上大量内容很好地平衡了准确性的问题。企业可以使用这个新工具将他们手机关于基于文本的内容数据放到更好的上下文中。例如,一家运动服饰公司可以将Twitter上其标识出现在用户图像中的次数进行对比,以创建更完整的用户参与情况。营销团队可以从结果中得到信息,以评估最近一次社交媒体活动带来的影响。或者,同样的数据可以用来对比品牌竞争情况。此外,Salesforce表示EinsteinEnvisionforSocialStudio对于那些要求更彻底查看用户行为(借助预编程的视觉库)的任务来说也是有用处的。这款工具可以识别1000种不同的对象、200种食物、60种场景以及超过200万个标识。连锁餐厅可以利用这种能力来检查最吸引消费者注意的菜肴,以及了解季节性变化相关的信息。Salesforce认为,其他行业的企业也可以在他们自己特定的领域中使用这个工具。这次发布Einstein Vision for Social Studio只支持Twitter,但是根据报道,Salesforce未来还将陆续增加更多平台。此外预计Salesforce还将拓宽这款服务能够识别的对象范围以触及更多市场。鉴于面对Crimson Hexagon的竞争,后一点尤为重要,更不用其他社交媒体监控提供商也将不可避免地加入计算机视觉的竞赛中来。

联邦贸易委员会要求社交媒体公司提供用户数据(Internet)
美国联邦贸易委员会(Federal Trade Commission)要求包括Facebook和Twitter在内的9家科技公司提供大量数据,这可能是该行业对数据处理进行监管的前奏。联邦贸易委员会周一提出的要求旨在获得以下信息:这些公司有多少用户,用户的活跃程度,这些公司对他们有什么了解,他们是如何获得这些信息的,以及这些公司采取了哪些措施来继续吸引用户。该机构还想知道社交媒体和视频流公司是如何处理他们收集的数据的,以及他们能够对用户属性、兴趣和互动做出什么样的推断。此外,该委员会正在收集有关这些公司的商业模式以及它们如何针对性的获取儿童和家庭的信息。联邦贸易委员会要求调查的公司包括Facebook、WhatsApp、Snap、Twitter、YouTube、ByteDance、Twitch、Reddit和Discord。该委员会在一份声明中表示:“所收集的数据将用于一项研究,该研究将揭开社交媒体和视频流媒体公司的面纱,仔细研究他们的引擎。”声明指出“尽管这些数据在我们的日常生活中扮演着核心角色,但在线平台对消费者和消费者数据做出的处理决定仍然是保密的。平台对于有关商业模式、算法以及数据收集和使用的关键问题一直没有做出回应。”它补充道:“决策者和公众对社交媒体和视频流服务在捕捉和销售用户数据与注意力方面所做的事情一无所知。令人担忧的是,我们对仍然这些如此了解我们的公司知之甚少。”非法调查并非所有委员会成员都支持数据转储要求。专员Noah Joshua Phillips持不同意见,他表示:“此举是对不同情况的无组织性的尝试,有些只与这次调查的重点有着很微小的关系。”他坚称:“今天采取的行动利用了稀缺的政府资源,以促进公众对消费者数据隐私处理做法的理解。这些做法对于为美国和国际上正在进行的政策讨论提供信息至关重要,从而对科技公司的一系列抱怨采取行动。”他补充:“调查的广度,调查各部分的相关性,以及接受者的不同,使得他们不太可能产生公众需要的那种信息,而且最终肯定会将稀缺的委员会资源更好地转移到其他地方。”华盛顿公共政策研究所Cato Institute的高级研究员Julian Sanchez也对联邦贸易委员会此举的明智性提出质疑。他表示:“信息请求的广度涵盖从数据实践到广告再到商业战略的方方面面。这次调查选择了9家商业模式截然不同的公司,给人一种非法调查的感觉。鉴于联邦贸易委员会主要是一个执法机构,我不知道这种无限制的数据调查是不是最好地利用了他们有限的人力。”他补充道:“在我看来,让国会带头审查行业隐私,以为联邦隐私政策提供信息,而让联邦贸易委员会专注于调查具体的违规行为,这会更符合常理。”需要进行数据转储位于华盛顿的在线公民自由和人权倡导组织民主与技术中心(Center for DemocraticTechnology)隐私与数据项目主任Michelle Richardson反驳道:“虽然联邦贸易委员会的信息需求是巨大而复杂的,但这是必要的。”她告诉TechNewsWorld:“如果打算继续对不良行为进行处理或起草公司指南,将需要大量的信息。这仅仅只是第一步,其最终目的将是为了消费者的利益而对这些公司进行更严格的审查。”她补充说:“这可能导致一份面向公众的报告出台,以告知消费者,让他们能够做出更好的选择。同时,这将使联邦贸易委员会在起草案件方面能够更明智地进行选择,并帮助它设定一个明确的问题基线,以询问所有公司。”Abine是一家总部位于波士顿的软件制造商,用于管理密码、屏蔽电子邮件、拦截广告和追踪器,其首席执行官兼联合创始人Rob Shavell坚称,根据从监管行业所收集到的数据进行此类研究是联邦贸易委员会工作的一部分。他向TechNewsWorld表示:“拥有这些信息很重要,这样国会就可以根据实际数据而不是公司关于其数据的陈述来做出决定,这可以避免结论出现误导性。”隐藏的反垄断思想然而,IT研究与分析集团The Analyst Syndicate的首席财务官French Caldwell断言,该委员会对数据需求的兴趣似乎不仅仅是隐私。他告诉TechNewsWorld,“他们的所作所为已经超越了他们自称的目的。他们这么做的唯一原因是,他们正在研究反垄断,而不仅仅是隐私。”尽管消费者应该是联邦贸易委员会数据抢夺的受益者,但他们可能不是主要受益者。印第安纳大学研究所副教授Fred H. Cate表示:“联邦贸易委员会收集信息的最大受益者将是监管者。”他向TechNewsWorld 表示:“他们更能够了解将要发生什么,这将决定他们是否会采取其他措施,或者他们是否对所了解到的内容感到满意,并就此停止。在这种情况下,消费者可能根本受益不大。”他补充道:“我认为,我们公众并不知道该如何处理这样的信息。如果每家社交媒体公司都在数据方面做同样激进的事情,我真的会在别无选择的情况下放弃它吗?”停止制造恐慌加州库比蒂诺的一家技术研究和咨询公司Constellation Research的副总裁兼首席分析师Liz Miller坚持认为,缺乏研究重点将减少对消费者的潜在好处。她向TechNewsWorld表示:“与联邦贸易委员会之前的研究举措(例如,对于处理香烟公司广告的做法以及这些品牌举措对儿童吸烟的造成影响)不同,目前的调查似乎没有具体的结果,只是表示社交媒体和科技发展并不好。”她补充:“作为一个在很大程度上以研究为中心的人,我完全支持对技术的影响进行真正的调查以及在这种情况下,社交媒体对社区的影响,但这项研究的范围应是随机的。”由于大多数有关技术法规的法律已经过时,Miller期待看到对该行业进行更多调查。她表示:“我希望看到更加明智的立法,基于当前和未来的数字消费、发展和业务的现实,而不是像那些邪恶的科技精英一样到处散布恐慌。”

谷歌跟踪代码管理器(GTM) 入门指南 第4部分——社交媒体
主编前言:很多朋友都听说过Tag Management(监测代码管理),但其强大的功能和实现方式,了解的朋友不多。本系列以Google Tag Manager(GTM)为例,介绍如何实现集约化的Tag Management,从而实现更优化的监测代码配置。这是这个系列的第四篇文章。关于如何通过GTM管理社交媒体的监测代码。这是谷歌跟踪代码管理器(GTM)系列简介的第四部分——社交媒体代码。如果想从头学起,可以去看看该系列的第一部分,第二部分和第三部分。第五部分也会很快上线。其实,谷歌分析本身已记录了你网站所有来自社交渠道的流量。这包括Facebook,Twitter,LinkedIn,Pinterest,Youtube,Google+和其他许多不知名的社交平台。 这些访问被独立分到一个名为“社交”的渠道,您可以在谷歌分析里的“流量获取>所有流量>渠道”下查看到。而部分社交访问可能也会被记录在在引荐渠道里面,是因为有一些较小的社交平台不被Google识别,就会被归类为引荐来源渠道。在“流量获取>社交”上可查看所有的社交来源流量的报告。在“概览”一栏,则展示了每个社交网络在流量转化上有多成功以及其他一些渠道的报告。在“社交”部分中还有一个名为“插件”的报告,这张报告中的内容可以通过GTM来部署实施。社交插件(我也不清楚为什么这个报告会被叫做“插件”,我想有天这张报告会改个名字。)记录了在您网站发生的社交动作。这包括在访客对你的Twitter主页的访问,点赞Facebook主页或是在把你的文章分享到LinkedIn。这些都属于与你网站内容互动的指标,在我们的博客页面上,我们也同样跟踪了所有的这些指标。因此,请随意分享这篇文章(看看文章左边的那些按钮),这样我就可以测试它们是否能正常运行了!以上报告中大部分的数据都可以通过在GTM上配置完成,实际上,如果你按第三部分内容安装了外部链接代码,你可能已经完成了一部分配置工作。让GTM无法正常工作的唯一原因可能是,如果你的网站用的是第三方的社交分享插件,那么GTM就无法检测到链接的点击。从你的网站点击跳转至社交网站如果您已经将外部链接发送到Google Analytics(请参阅第3部分),那么你的社交链接点击次数就将被记录为“事件”。你可以在“社交”报告部分看到该部分的数据,另外你还可以选择触发该事件,或者通过编辑外部链接触发器的方式,使某些外部链接不被触发(包括Facebook、Twitter、Linkedin)。你需要构建以发送社交数据的标记如下所示 - 关键设置是“Track Type=Social”。 我使用了“Action = Page”表示在Twitter页面上的点击,并且”Action Target”将记录用户在点击链接时所在的页面。页面的点赞数由于我们的网站没有此功能,因此我没有记录网页赞助的示例,但“社交分享”的说明将涵盖你所需要设置的所有内容。如果你使用第三方插件提供的点赞按钮,那么记录事件可能会很棘手。 你可以通过运行GTM预览模式来查看点击“赞”时是否记录了任何点击。 如果GTM没有记录到点击,那么点赞按钮实际上是不属于该网站的。社交分享Cucumber博客已启用社交分享功能,当阅读本文时,你应该会发现左侧的5个按钮。我们将设置的是当有人点击其中一个社交分享按钮时就会发送社交类型的“事件”。幸运的是,这些按钮都是用类似的方式提供,所以我们只需要一个触发器和一个标签来实现它。预览模式到目前为止,确定如何构建触发器的最简单的方法是使用GTM的预览模式。当我点击其中一个按钮时,一个gtm.linkClick就会被记录,Variables标签告诉了我需要知道的一切。在示图中已用黄色背景来突出这些部分。我可以使用图中的Click作为触发器,实际上是使用Click Classes (元素类属性中的一系列值)触发此变量。 即使每个点击的完整字符串不一致,但它们都是以相同的文本开头。触发器如图所示,只有当“Click Classes”以“at4-share”开头时,我们才会为我们的博客启用此触发器。截止目前,这些设置看起来都是比较容易的。要构建标签Tag,我们可以使用我们确定的其他变量Variable,名为Click Text(用户点击的元素内部的可见文本)。这是为了方便格式化我们的社交网络。我们设置“Action = Share”,并再次记录具体页面路径以确定哪个博客文章被共享了。标签设置好的标签图示那么你该如何查看你社交分析的统计数据呢? 在谷歌分析的“社交/插件”中点击“社交来源”和“行动”,添加一个“社会实体”的次要维度,就可以看到所有的社交分享数据出现都在同一个报告中。谷歌分析社交媒体报告图示那么现在你就可以去看看我们第五部分GTM的简介了,是关于表单提交跟踪相关的内容。

Jigsaw开源新的Chrome扩展工具Tune,可过滤社交媒体上的恶意评论
作者:马什么梅发布:ATYUN订阅号Jigsaw正在推出Chrome扩展,旨在帮助人们过滤社交媒体上的恶意评论。这个名为“Tune”的新开源工具建立在Jigsaw的Perpesctive中引入的机器学习智能的基础上。使用“过滤器组合”控件,用户可以完全关闭恶意评论(所谓的“禅模式”)或包含攻击,侮辱或亵渎的帖子。Tune还可以与Reddit,YouTube和Disqus一起使用。通过安装Tune,它要求你通过浏览器登录到你的谷歌帐户,你可以控制五个社交平台:YouTube、Twitter、Facebook、Reddit和Disqus。在上述某个网站上点击浏览器顶部的Tune图标后,你将看到一个数字音量拨号,通过旋转各种过滤器,从“全部显示”到“全部隐藏”。在完全模式中,你会看到一切:包括亵渎,侮辱,人身攻击,以及其他评论。当设置到左侧时,你几乎看不到任何评论。值得一提的是,Tune并非真正设计成一款完美的产品,现在这只是一项实验。基于简短测试,它肯定没有隐藏所有内容,并且很难根据它所显示的评论来发现某些设置之间的差异。尽管如此,它还有助于突出强调在线管理的效力,人类根本不可能单独完成这项工作。Tune与Perspective API不同,但它们具有相同的底层智能。虽然Tune还不是最终产品,但Jigsaw表示希望鼓励其他开发人员加入其构思,因此,Tune是GitHub上的开源项目。
Jigsaw产品经理CJ Adams说道,“Tune建立在相同的机器学习模型之上,可以让人们在许多流行的平台上设置对话的量,我们希望Tune能够激发开发人员找到新方法,让更多控制权掌握在人们手中,以调整在互联网上看到的评论水平。”Pew Research Center在2017年的一份报告发现,美国有40%的互联网用户遭遇过网络骚扰。然而,与Jigsaw的Tune扩展更为相关的是,该报告发现大约四分之一的美国人因害怕骚扰而决定不发布在线评论,而超过10%的人选择不使用网站。当然,Alphabet并不希望担心骚扰会渗透其在线服务,尽管它也急于指出它自己的YouTube并不是唯一受到困扰的平台。这就是为什么Tune可以在其他主要社交网络上使用。Adams补充道,“大多数人都会花更多的时间阅读在线评论,而不是写或审核他们,一个恶意帖子可能让我们彻底放弃讨论,错过阅读其中的宝贵想法。它们也会对谈话产生寒蝉效应,如果人们担心他们的贡献会被更响亮,更嘈杂的声音淹没,那么人们就不太可能加入在线讨论。”相关链接:https://github.com/conversationai/perspective-viewership-extension

为监控用户,纽约警方花费数百万美元抓取社交媒体数据
据Cyber News披露,美国纽约警方为了监视社交媒体上的用户及内容,花费数百万美元与一家曾被指控不当抓取平台数据的监控公司签订了合同。
监控公司 Voyager Labs 的产品声称能使用人工智能分析网络用户的行为。该公司表示,通过对大型数字文件进行快速分析,可帮助执法部门检测和预测欺诈和犯罪。根据倡导隐私权的非营利组织 "监控技术监督项目"(STOP)获取到的文件,早在 2018 年,该公司就与纽约警察局签署了一份价值近 850 万美元的合同。但随后,Voyager Labs 被科技巨头 Meta 起诉,称其涉嫌使用近4万个虚假 Facebook 帐户来收集大约 60万个用户的数据,换句话说,就是进行不当的数据抓取。与此同时,另一份文件显示,纽约皇后区检察机构也与以色列公司 Cobwebs Technologies签署了一项协议,使该公司向警方提供社交网络地图产品。虽然美国执法部门多年来一直与社交媒体分析公司合作,利用其中的信息辅助一些特定调查,但专家警告说,这种做法需要合法使用,特别是当警方试图通过获取私人信息,并跳过获取传票和搜查令等步骤来预测未来的犯罪行为时。STOP 主管威尔·欧文 (Will Owen)说道:“与 Voyager Labs 和 Cobwebs Technologies 签订的合同都扩大了执法部门对社交媒体的监控和其他天罗地网般监控工具的使用,这些工具长期以来一直针对包括儿童在内的纽约黑人和拉丁裔。”欧文认为,这是具有侵入性且非法的行为,宪法要求执法部门在对公众进行搜查之前必须获得搜查令,此举是对宪法的公然绕过。目前尚不清楚纽约警方到底如何使用 Voyager 软件,但法律允许其警察使用虚假的社交媒体资料。STOP 的实习生莉兹·黄 (Liz Huang) 为此担忧地表示,用户在社交媒体接受的每一个朋友和关注请求,都可能面临着来自警察的监视和对隐私的侵犯。

使用Puppeteer提升社交媒体数据分析的精度和效果
亿牛云代理导语社交媒体是互联网上最受欢迎的平台之一,它们包含了大量的用户生成内容,如文本、图片、视频、评论等。这些内容对于分析用户行为、舆情、市场趋势等有着重要的价值。但是,如何从社交媒体上获取这些数据呢?一种常用的方法是使用网络爬虫,即一种自动化地从网页上提取数据的程序。概述在本文中,我们将介绍如何使用Puppeteer这个强大的Node.js库来进行社交媒体数据抓取和分析。Puppeteer是一个可以控制Chrome或Chromium浏览器的API,它可以实现以下功能:生成网页截图或PDF文件模拟用户操作,如点击、输入、滚动等捕获网页上的元素,如文本、图片、链接等监听网页上的事件,如网络请求、响应、错误等评估网页上的JavaScript代码使用Puppeteer进行社交媒体数据抓取和分析有以下优点:可以处理动态渲染的网页,即那些需要执行JavaScript代码才能显示完整内容的网页可以模拟真实用户的行为,绕过反爬虫机制,如验证码、登录验证等可以灵活地定制爬虫逻辑,根据不同的社交媒体平台和数据需求进行调整正文在本节中,我们将详细介绍如何使用Puppeteer进行社交媒体数据抓取和分析的步骤。我们以Twitter为例,展示如何从Twitter上获取用户的基本信息、发表的推文、点赞的推文等数据,并对这些数据进行简单的分析。安装Puppeteer首先,我们需要安装Puppeteer这个Node.js库。我们可以使用npm或yarn这样的包管理器来安装。在命令行中输入以下命令:代码语言:javascript复制// 使用npm安装
npm i puppeteer
// 使用yarn安装
yarn add puppeteer启动浏览器和页面接下来,我们需要启动一个浏览器实例,并打开一个新的页面。我们可以使用puppeteer.launch()方法来启动浏览器,并使用browser.newPage()方法来创建页面。我们还可以传入一些选项来配置浏览器和页面的行为,例如是否显示浏览器界面、是否开启无头模式(即不显示浏览器界面)、是否忽略HTTPS错误等。例如:代码语言:javascript复制// 引入puppeteer库
const puppeteer = require('puppeteer');
// 启动浏览器
const browser = await puppeteer.launch({
// 是否显示浏览器界面,默认为false
headless: false,
// 是否开启无头模式,默认为true
devtools: true,
// 是否忽略HTTPS错误,默认为false
ignoreHTTPSErrors: true,
});
// 创建页面
const page = await browser.newPage();设置爬虫代理IP由于社交媒体平台通常会对频繁访问的IP地址进行限制或封禁,所以我们需要使用代理IP来提高爬虫效果。代理IP是指可以替代我们真实IP地址访问目标网站的其他IP地址,它可以帮助我们隐藏真实身份,避免被识别或屏蔽。我们可以使用亿牛云爬虫代理这样的服务来获取代理IP,它提供了高速稳定的代理IP池,支持多种协议和地区,还有免费试用的机会。要使用亿牛云爬虫代理,我们需要先注册一个账号,并获取域名、端口、用户名、密码等信息。然后,我们可以使用puppeteer.launch()方法的args选项来设置代理IP,例如:代码语言:javascript复制// 启动浏览器
const browser = await puppeteer.launch({
// 是否显示浏览器界面,默认为false
headless: false,
// 是否开启无头模式,默认为true
devtools: true,
// 是否忽略HTTPS错误,默认为false
ignoreHTTPSErrors: true,
// 设置代理IP
args: [
// 使用亿牛云 爬虫代理的域名和端口
`--proxy-server=http://www.16yun.cn:9180`,
// 使用亿牛云爬虫代理的用户名和密码
`--proxy-auth=16YUN:16IP`,
],
});访问目标网站有了浏览器和页面,我们就可以开始访问目标网站了。我们可以使用page.goto()方法来跳转到指定的网址,并等待网页加载完成。我们还可以传入一些选项来控制跳转的行为,例如是否等待网络空闲、是否等待指定的选择器出现等。例如:代码语言:javascript复制// 访问Twitter首页
await page.goto('https://twitter.com/', {
// 等待网络空闲,即没有超过0.5秒的网络请求
waitUntil: 'networkidle0',
});模拟用户操作有时候,我们需要模拟用户的一些操作,才能获取到我们想要的数据。例如,我们可能需要登录账号、输入关键词、点击按钮、滚动页面等。Puppeteer提供了一系列的方法来实现这些操作,例如:page.type()方法可以在指定的选择器中输入文本page.click()方法可以点击指定的选择器page.waitForSelector()方法可以等待指定的选择器出现page.waitForNavigation()方法可以等待页面跳转完成page.evaluate()方法可以在页面上执行JavaScript代码例如,我们可以使用以下代码来登录Twitter账号:代码语言:javascript复制// 点击登录按钮
await page.click('a[href="/login"]');
// 等待登录页面加载完成
await page.waitForNavigation({ waitUntil: 'networkidle0' });
// 输入用户名和密码
await page.type('input[name="session[username_or_email]"]', 'your_username');
await page.type('input[name="session[password]"]', 'your_password');
// 点击提交按钮
await page.click('div[data-testid="LoginForm_Login_Button"]');
// 等待首页加载完成
await page.waitForNavigation({ waitUntil: 'networkidle0' });提取数据元素当我们访问到我们想要的网页后,我们就可以开始提取数据元素了。Puppeteer提供了一些方法来获取网页上的元素,例如:page.$()方法可以返回一个匹配指定选择器的元素对象page.$$()方法可以返回一个匹配指定选择器的元素对象数组page.$eval()方法可以对一个匹配指定选择器的元素对象执行回调函数,并返回结果page.$$eval()方法可以对一个匹配指定选择器的元素对象数组执行回调函数,并返回结果例如,我们可以使用以下代码来获取Twitter上一个用户的基本信息,如昵称、简介、关注数、粉丝数等:代码语言:javascript复制// 访问一个用户的主页,例如@elonmusk
await page.goto('https://twitter.com/elonmusk', {
waitUntil: 'networkidle0',
});
// 获取用户昵称
const name = await page.$eval(
'div[data-testid="primaryColumn"] div[dir="ltr"] span[role=“heading”]', (el) => el.textContent );
// 获取用户简介
const bio = await page.$eval( ‘div[data-testid=“primaryColumn”] div[dir=“auto”] span’, (el) => el.textContent );
// 获取用户关注数
const following = await page.$eval( ‘div[data-testid=“primaryColumn”] a[href=“/elonmusk/following”] span’, (el) => el.textContent );
// 获取用户粉丝数
const followers = await page.$eval( ‘div[data-testid=“primaryColumn”] a[href=“/elonmusk/followers”] span’, (el) => el.textContent );
// 打印用户基本信息
console.log(昵称:${name}); console.log(简介:${bio}); console.log(关注:${following}); console.log(粉丝:${followers});分析数据内容当我们提取到数据元素后,我们就可以对数据内容进行分析了。Puppeteer可以让我们在页面上执行任意的JavaScript代码,所以我们可以使用JavaScript的内置或第三方库来进行数据分析。例如,我们可以使用以下代码来获取Twitter上一个用户的发表的推文,并对推文的情感进行分析:代码语言:javascript复制// 引入sentiment库,用于情感分析
const sentiment = require('sentiment');
// 获取用户发表的推文
const tweets = await page.$$eval(
'div[data-testid="tweet"] div[dir="auto"] span',
(els) => els.map((el) => el.textContent)
);
// 对每条推文进行情感分析,并打印结果
tweets.forEach((tweet) => {
// 使用sentiment库对推文进行情感分析,返回一个对象,包含分数、比较度、正面词、负面词等信息
const analysis = sentiment(tweet);
// 打印推文和分析结果
console.log(`推文:${tweet}`);
console.log(`分数:${analysis.score}`); // 分数越高,表示情感越正面;分数越低,表示情感越负面
console.log(`比较度:${analysis.comparative}`); // 比较度表示每个单词的平均分数,范围在-5到5之间
console.log(`正面词:${analysis.positive}`); // 正面词表示推文中的正面情感词汇
console.log(`负面词:${analysis.negative}`); // 负面词表示推文中的负面情感词汇
});案例为了更好地理解如何使用Puppeteer进行社交媒体数据抓取和分析,我们可以看一个完整的案例。在这个案例中,我们将从Twitter上获取@BillGates这个用户的基本信息、发表的推文、点赞的推文等数据,并对这些数据进行简单的分析。完整的代码如下:代码语言:javascript复制// 引入puppeteer库
const puppeteer = require('puppeteer');
// 引入sentiment库,用于情感分析
const sentiment = require('sentiment');
// 定义一个异步函数,用于执行爬虫逻辑
async function scrapeTwitter() {
// 启动浏览器
const browser = await puppeteer.launch({
// 是否显示浏览器界面,默认为false
headless: false,
// 是否开启无头模式,默认为true
devtools: true,
// 是否忽略HTTPS错误,默认为false
ignoreHTTPSErrors: true,
// 设置代理IP
args: [
// 使用亿牛云爬虫代理的域名和端口
`--proxy-server=http://www.16yun.cn:9180`,
// 使用亿牛云爬虫代理的用户名和密码
`--proxy-auth=16YUN:16IP`,
],
});
// 创建页面
const page = await browser.newPage();
// 访问Twitter首页
await page.goto('https://twitter.com/', {
// 等待网络空闲,即没有超过0.5秒的网络请求
waitUntil: 'networkidle0',
});
// 点击登录按钮
await page.click('a[href="/login"]');
// 等待登录页面加载完成
await page.waitForNavigation({ waitUntil: 'networkidle0' });
// 输入用户名和密码
await page.type('input[name="session[username_or_email]"]', 'your_username');
await page.type('input[name="session[password]"]', 'your_password');
// 点击提交按钮
await page.click('div[data-testid="LoginForm_Login_Button"]');
// 等待首页加载完成
await page.waitForNavigation({ waitUntil: 'networkidle0' });
// 访问@BillGates的主页
await page.goto('https://twitter.com/BillGates', {
waitUntil: 'networkidle0',
});
// 获取用户昵称
const name = await page.$eval(
'div[data-testid="primaryColumn"] div[dir="ltr"] span[role="heading"]',
(el) => el.textContent
);
// 获取用户简介
const bio = await page.$eval(
'div[data-testid="primaryColumn"] div[dir="auto"] span',
(el) => el.textContent
);
// 获取用户关注数
const following = await page.$eval(
'div[data-testid="primaryColumn"] a[href="/BillGates/following"] span',
(el) => el.textContent
);
// 获取用户粉丝数
const followers = await page.$eval(
'div[data-testid="primaryColumn"] a[href="/BillGates/followers"] span',
(el) => el.textContent
);
// 打印用户基本信息
console.log(`昵称:${name}`);
console.log(`简介:${bio}`);
console.log(`关注:${following}`);
console.log(`粉丝:${followers}`);
// 获取用户发表的推文
const tweets = await page.$$eval(
'div[data-testid="tweet"] div[dir="auto"] span',
(els) => els.map((el) => el.textContent)
);
// 对每条推文进行情感分析,并打印结果
tweets.forEach((tweet) => {
// 使用sentiment库对推文进行情感分析,返回一个对象,包含分数、比较度、正面词、负面词等信息
const analysis = sentiment(tweet);
// 打印推文和分析结果
console.log(`推文:${tweet}`);
console.log(`分数:${analysis.score}`); // 分数越高,表示情感越正面;分数越低,表示情感越负面
console.log(`比较度:${analysis.comparative}`); // 比较度表示每个单词的平均分数,范围在-5到5之间
console.log(`正面词:${analysis.positive}`); // 正面词表示推文中的正面情感词汇
console.log(`负面词:${analysis.negative}`); // 负面词表示推文中的负面情感词汇
});
// 关闭浏览器
await browser.close();
}
// 调用异步函数,开始爬虫任务
scrapeTwitter();结语本文介绍了如何使用Puppeteer这个强大的Node.js库来进行社交媒体数据抓取和分析。Puppeteer可以让我们控制Chrome或Chromium浏览器,模拟用户操作,提取网页元素,执行JavaScript代码等。我们可以使用Puppeteer来从不同的社交媒体平台上获取我们想要的数据,并对这些数据进行简单或复杂的分析。Puppeteer是一个非常有用和灵活的工具,可以帮助我们实现各种网络爬虫的需求。

全球主流社交媒体算法解析:Facebook、YouTube、Twitter如何利用算法推荐内容?
作者Ste Davies (转载自“腾讯媒体研究院”)在如今的世界中,算法已经成为了我们日常生活的核心。当你进行网络搜索,滚动浏览社交媒体上的信息,或者从Spotify上接收到歌曲推荐时,实际上你正在被算法指导,甚至算法比你本人更了解你的消费习惯。每天,你的决策和选择都会受到算法的影响。这些数学上的计算会影响你在亚马逊上的购买决定、你的购物历程,甚至是否在购物车中保留你喜欢的麦片。算法就像魔术一样,当他们正在运行时,你完全无法识别他们。他们在你和你的任务之间悄无声息地运作着。虽然听起来很危险,但总的来说,算法可以为你提供帮助。社交媒体算法正在成为你所做的所有事情的核心。虽然算法经常错误地理解人类,出现不准确的情况,但是他们一直在学习。你,以及整个社会的新闻和信息消费方式可以直接归因于算法。无论是在Google上搜索还是在Facebook和Twitter上滚动浏览,呈现的新闻和信息的方式均来自一个数学方程式,基于以下两个因素:1.算法质量——内容的质量标准。2.历史记录——过去你对特定内容所做的动作和反应。这意味着无论是被设计的还是个人选择,社交媒体算法都使我们能够创建过滤器以查看所需内容,并删除所有我们不需要的内容。此外,业内还出现了一种“算法可能会引起信息极化和偏差”的说法。因此,了解算法并了解算法何时发挥作用,这一点很重要。算法的重要性还体现在哈佛商学院的一项研究中,研究发现人们更有可能遵循来自算法的建议,而不是人的建议。这正是本文诞生的原因之一。本文提供了一种指导方法——当算法控制了你的阅读时,你该如何思考。首先,本文并不打算列出算法内部的确切的计算原理,而是将重点放在囊括当前主流社交媒体算法的主要特点。其次,文中所展示的图表并不是算法的可视化,它们更多地是展示某些决定性问题,而不是算法方程式。本文作者为Ste Davies,由腾讯媒体研究院编译。你可以遵循这篇文章来迭代自身内容,以确保能在各大平台获得最大的影响。本文内容纲要:Facebook算法发展及解析Twitter算法发展及解析Instagram算法发展及解析YouTube算法发展及解析日新月异的社交媒体算法早期社交媒体的目的是为那些在现实生活中无法联系的人们提供一个线上联系的渠道。比如Facebook上的家人和朋友;Linkedln上的同事和工作熟人;以及Twitter上的任何人。随着各平台不断地成长,以及不断地探索变现的方法,这些平台开始丰富他们的产品。新闻分发是其中的关键组成部分。社交媒体尤其是Facebook,开始把自己定位为新闻发布的渠道。随着越来越多的人开始通过他们接收新闻,Facebook改变了自己的算法以适应这种变化,新闻出版机构致力于在这些平台上扩大受众,并越来越多地制作简短有趣又可共享的内容。2015年,Facebook超越Google,成为新闻网站的第一大流量来源,巩固了其作为社交网络巨头的地位。然而,事故随之而来。标题党文章、虚假新闻、机器人、网络喷子开始占领社交媒体平台。Facebook算法(也许是世界上最著名的算法)处于漩涡中心。报告显示,人们在访问Facebook和Twitter之后感到更高程度的焦虑和不满。社交媒体平台变成了黄色新闻的传播者,他们没有建立人与人之间的交流,反而促使了群体的分裂。自2018年以来,社交媒体算法的潮流再次改变。Facebook宣布,他们打算优先传播“有意义的对话”而不是新闻报道。Twitter正在终止平台上的自动化,这意味着所有由机器人创造的虚假数据如点赞,关注或者转发将会被消除。LinkedIn的状态更新优先级将给予那些敢于展示更多个性化和个人生活的专业用户。所有的平台都将优先展示自己平台上的原创内容,而不是第三方链接。在2018年,“搜索”超过了“社交”,自2015年来首次成为社交网站上新闻网站的更大引荐来源。这是社交媒体新时代的开始。如今这个时代更注重人际关系,而不是信息消费。这也是为什么如今网红营销蒸蒸日上的原因之一。品牌希望与社交媒体网红合作,因为他们已经与受众建立了深厚的联系。算法规则再次被改变。对于许多发布者而言,这意味着流量的终结,甚至在某些情况下,这意味着他们整个业务模型的终结。对于那些希望在社交媒体中分一杯羹的品牌来说,它们则需要转变观念。现在的算法不仅仅是为一个受众,而是关于建立社区;不再是吸引注意力,而是使内容更具对话性;它的最终目的是用更坦白的方法参与用户的社交活动。为什么我们需要了解社交媒体算法如果不理解社交媒体算法是如何工作的,就如同在黑夜中开车不开灯。虽然在这种情况下你也有可能达成目标,但我们没有必要冒这个风险。简而言之,出于以下原因,你需要了解它们:影响:确保您的内容产生最大的影响投资回报率:确保你为内容制作和发布所花费的时间和精力能获得最大的回报。声誉:长期成为算法系统中的可靠信息源。扩大社会影响力:我们必须能够“以其人之道还治其人之身”,以防止虚假信息在网上传播各大社交平台正在不断地改变、完善和测试他们的算法。最重要的是,我们要跟上他们的步伐。准备好了吗?让我们开始研究社交媒体算法吧。Facebook算法Facebook可能拥有世界上最著名(或臭名昭著)的社交媒体算法。
在过去的几年中,它一直处于争议的中心,不仅在美国和欧洲,而且在世界各地都引起争议。由于Facebook希望为用户提供更多价值,为广告吸引更多的注意力,因此它不断地进化算法。也许这就是为什么,它会与Google搜索算法一起成为传统和互联网媒体持续裁员的主要原因。Facebook算法以前被称作EdgeRank,在过去几年中它由于种种过失而备受关注。因为该算法导致了一种病态的情况:自然接触率几乎消失,新闻信息流已近消亡,标题党和假新闻濒于垮台。1 / 用户自由访问率大幅下滑2014年,Facebook的专页用户注意到他们的用户访问率开始下降。尽管数字有所变化,但平均用户访问率却从16%下降至6.5%。一个拥有10,000个粉丝的专页只会吸引其中的650个点击浏览。拥有超过500,000名粉丝的专页用户,他们的用户访问率陡降至2%左右。Facebook表示,这样做仅仅是因为平台上的内容变多了,所以人们应该只看到与他们最相关的内容。从那以后,Facebook继续调整该算法,进一步降低了专页的用户访问率。大约在同一时间,Facebook专页在Facebook平台上的广告收入几乎达到了顶峰,然而不久后,它就依靠Instagram来实现大部分收入增长。如今,Facebook专页更适合用于开展广告活动,而不是其他任何活动。2 / 互联网不断渗透,过新闻信息流正在退出主场,与用户相关的生活内容才是王道生活内容改变了社交媒体的格局,而新闻信息流遭受重击。消费者最想要看到的内容是他们朋友、家人和KOL们在Instagram,Snapchat和Facebook上发布的短内容。而新闻信息流成为了旧时代的遗物。尽管它不会很快消失,但它将不再具有曾经对社会的影响。Facebook将生活内容视为未来,并声称每天有十亿条内容在其平台上共享,但到目前为止,它们还无法像其他广告资源那样从中获利。不过,生活内容是前进的方向,永远不要低估Facebook的获利能力。3 / Facebook将不再宽容地对待虚假新闻和标题党曾经,在Facebook上“病毒式传播”是一件很容易的事。制作一段人们会共享的内容,并采用不错的发行方式,就可以保证将其传播到整个Facebook平台。这就是BuzzFeed与其他发行商(例如紧随其后的Unilad)建立他们业务模式的基础。内容被设计为“可点击”和“可共享的”,因为它们利用了社交心理触发因素,这些触发因素会唤起人们对爱情,幽默,恐惧或愤怒的情绪。这一策略常常被运用,人们用各种不道德的方法制作虚假的内容。这个旧的Facebook算法,其病毒性元素在2016年美国大选和英国脱欧中都产生了巨大的影响。有关这两个事件的内容都主要在Facebook上播放,很轻易地传播各种假新闻,并且用标题党来篡改知名新闻来源的内容尽管Facebook仍有推动假新闻传播的倾向,但该公司最近删除了1400万条恐怖内容,建立“选举战情室”以维护各地选举,要求浏览网站和政治广列的用户验证其身份。通过这种方式来提高控制和根除虚假新闻的能力。在分享新闻方面,Facebook的用户习惯也发生了变化。一项研究显示,出于对隐私的关注,他们更喜欢使用消息应用程序WhatsApp和Messenger(均为Facebook Inc.拥有)与密友和熟人共享和讨论新闻。4 / 新的Facebook算法负面媒体报道的累积,以及研究发现人们访问Facebook后会感到不开心,这两项原因促使该公司迅速采取行动,删除了有关使人发疯,难过或悲伤的内容的共享。排名因素。资料来源:Facebook,作者Matt Matt Navarra马克·扎克伯格(Mark Zuckerberg)在2018年1月发布的公告中说,新的算法将优先考虑“有意义的社交互动”。在扎克伯格的帖子中,他概述了以算法为中心的Facebook的新发展方向。“我们营造的Facebook的方法正在发生重大改变。我改变了产品团队的目标,从专注于帮用户找到相关内容,转变为帮助用户得到更多有意义的社交互动。”这意味着,Facebook算法现在将优先考虑推荐一些可以引起朋友和家人讨论的内容,而不是标题党内容和第三方链接。Facebook提供的有意义的互动包括:个人评论、对他人的状态更新或照片的点赞个人对朋友分享的内容所做出的回复视频或文章评论中的多人互动通过Messenger共享链接与一群朋友开启对话此举引发了一些依赖Facebook作为交流平台的企业和组织的担忧。媒体行业的员工以及像LittleThings和Unilad之类的出版商受到了极大的影响。由于新算法的引荐流量突然下降,他们被迫关闭或者被收购。但是,由于自然接触率一直处于历史最低水平,以及优先考虑亲朋好友之间的交流的举措,许多组织开始质疑,在Facebook上投入精力是否值得。鉴于其庞大的规模和流量优势地位,Facebook仍值得创作者们付出努力,但是需要用一种新的方式来改变算法。5 / 我们对Facebook算法了解多少?和原来所想的不一样,Facebook声称他们并没有在最初与26个人分享你的内容可以用一个面向小部分用户的帖子来测试初始参与度Facebook算法将优先推荐促进朋友和家人之间对话的内容Facebook将优先推荐Messenger共享的链接用户的积分(页面的完整性,共享历史等)是排名因素被用户分享并引起进一步讨论的品牌或发布者内容将获得优先推荐Facebook算法将优先推荐实况视频,因为它会收到更多互动比起第三方链接帖子,本地视频帖子会获得更多的参与度参与度的计算将基于积分系统带有长评的帖子将获得更高的权重本地内容优先于第三方链接内容根据Buffer的研究,每天发布五条内容或许是最佳方案标题党,以及要求人们“点赞,评论或分享”的内容会被降低权重耸人听闻的内容会被该算法标记Facebook算法将降低出现标题错误的文章的排名6 / Facebook算法排名因素——7 / 如何适应Facebook算法?有意地制作可以推动Facebook用户讨论的内容
这是Facebook的新常态,任何使用该算法的人,如果他们希望在该平台上获得好的反馈的话,在制作内容时都应该考虑到这一点。采取80/20作为原创内容和他人内容的比例
Facebook希望用户为该平台创造内容,但是如果你的目标是为自己的网站引流,那你需要采取合适的举措。算法在以下情况中可以帮助你:成为可靠的内容生产者,制作原创内容,只在极少的时候链接到你自己的网站。尽可能使用直播视频来提高参与度
Facebook明确表示,他们将优先推荐直播视频,因为他们知道直播视频的参与度是任何其他内容的六倍。任何能够推动有意义的参与的事情,都是值得做的。制定一个总体的视频战略
在可预见的未来,优质的本地视频仍将在Facebook中占据领先地位。定一个目标:要成为算法眼中的优质内容(有选择地分享你的内容)
不要在Facebook上分享你的所有内容。如果该内容没有产生参与度,那么你的积分就会降低。仅分享你认为适合平台和受众的内容。绝对不能有标题党,骗赞和过度营销的内容
Facebook算法将标记标题党、耸人听闻的文章、要求用户点赞,评论和分享的内容以及过度营销的内容。如果要成为算法眼中的可靠账户,请不要执行任何这些操作。Twitter算法退一步说,Twitter自成立以来的经历波澜起伏。实际上,Twiter多年来一直无利可图,直到2018年它才实现了首次年度盈利。
尽管具有盈利能力,但Twitter正在失去用户,这与它清理平台,删除垃圾邮件和机器人帐户有关。Twitter可能仍将是一个利基社交网络,但它吸引的用户类型是世界上最具影响力的一些用户。这个平台受到了媒体和政治精英的青睐,在推动新闻议程方面发挥着关键作用。Twitter的实时性,极易上手,不需要任何写博客或者创建博客等技术知识,这些可能是Twitter在这些人中受欢迎的原因。1 / Algorithmic Timelines引言2016年Twitter推出了它的算法,被称之为“Algorithmic Timelines”。在此之前,当你登录Twitter时,你的信息流是按逆序排列的,你关注的人的最新推文被排在首页顶部。但是现在登录Twitter的话,情况有所不同。它不再按时间顺序排列,你的时间轴顶端的内容可能是30分钟前发布的消息,而最近的推文可能会在后面显示。这是目前正在使用的算法,旨在根据用户先前对平台的使用情况,为用户提供最相关的内容。算法认为你会觉得这些内容最重要,所以把这些推文推送给你。当你在制定Twitter策略的时候,必须考虑到这一点。不过,Twitter为用户提供了在算法时间轴和正常时间轴之间切换的选择,尽管默认情况下是使用算法时间轴。2 / 网络喷子,机器人账号和选举和Facebook一样,Twitter近年来一直是争议的焦点。它被指控为匿名的网络喷子和极端主义团体提供了一个平台,可以大肆宣扬恶毒言论和仇恨,并容许俄罗斯帐户和机器人账户介入2016年美国总统大选。去年1月,Twitter声称,他们已删除了50,000个与俄罗斯有关的帐户,这些账号使用该平台发表了与2016年选举有关的、机器生产的恶意内容。这也促使了去年2月Twitter算法进行了新一轮改进。从现在开始,将不允许在Twitter平台上发表自动化内容(或使用机器人账号)。Twitter通过以下声明向服,明确警告了那些使用机器人账号的服务商:“不允许使用任何形式的自动化(包括计划使用)来发布相同或基本相似的内容,也不允许一人操控多个账号进行点赞或转发等操作(无论你是否创建或直接控制这些帐户)。”3 / 在280个字的限制下运用算法时间轴Twitter算法的目的是增强时间轴的相关性,以便用户可以捕获重要的推文,否则他们会错失与他们互动最多的人之间的交流机会。与此同时,Twitter仍将自己视为实时新闻网站以及社交平台。当你登陆账户时,首页会询问“正在发生什么?”,Twitter通过这一举措来增强以上两种属性。它不会向你展示几天前的推文,因为按照Twitter的标准,它们太旧了。Twitter的目的是帮助人们发现“现在正在发生的事情”,与之相比,Facebook或LinkedIn则更多地关注“本周发生的事情”。因此,虽然该算法会把较旧的推文展示在首页顶端,但时间仍然是重要的因素。而且,如果你希望自己的推文获得尽可能多的覆盖率和参与度,你必须适应该算法。2017年9月,Twitter做出了迄今为止最大胆的改变之一,将字符数限制从140个增加到280个。这引起了用户的愤怒,他们认为此举将导致该平台的灭亡。但是事后看来,Twitter制定了一项不错的计划,因为通过对语言的参与度数据进行分析后发现,推文中可以容纳更多的内容。他们发现日语推文(这种文字允许更多的内容)比英语推文获得了更多的参与度。话虽如此,据报道,截止2018年10月,平均推文长度仍然只有35个字符。4 / 我们对Twitter算法了解多少?时间在Twitter算法中占重要地位信誉度高的账户受到算法的青睐字数控制在280个字以内可提高参与率尽管可以分享链接,但平台内的内容权重将高于第三方链接内容与您互动最多的人的推文将排在顶部可以用一个面向小部分用户的帖子来测试初始参与度点赞,回复和转发能得到较高分数即使你与某些内容没有互动,阅读改文章或访问某个人的个人资料所花费的时间仍将影响你的首页内容。你与他人的互动越多,算法就会更多地为你推荐他所关注的内容(如果他们关注你的话)5 / Twitter算法排名因素——6 / 如何适应Twitter的算法?发布时间:在粉丝在线的时候发送推文
使用第三方服务(例如Tweroid或ManagerFlitter)来了解,你的粉丝通常在一天中的什么时间在线。这个时间段是最好的发布时间,能够确保你的推文在粉丝中获得尽可能多的曝光度。推文拥有的曝光度越高,互动的几率就越大。通过围绕特定主题或领域来建立粉丝基础,以此提高相关性和参与度
有些人为了使自己看起来很有影响力而买粉,或者他们用机器人来关注或取关大量账号,以此快速增加自己的粉丝数。
这样做的问题是,他们发推时很少收到互动。因为他们的大多数粉丝要么是垃圾账号,要么是不相关的账号。
谢天谢地,现在Twitter禁止了这种数据操作。对我们所有人来说,我们从中学到的是:
要制作参与度高的推文,你必须拥有相关且响应迅速的受众。不需要关注大量不相关账号,以希望他们回关你。相反,你需要重点对待你关注的账号,因为时间长了之后,这些类型的帐户有可能会关注您。根据粉丝的喜好来制作推文
Twitter Analytics(分析)不仅提供了大量关于你的推文的数据,而且提供了大量关于粉丝的数据。它将告诉你粉丝的主题兴趣,并按百分比细分。
一旦了解了粉丝的兴趣,就可以根据他们的喜好制作推文。内容与粉丝越相关,他们参与的可能性就越大。使用280个字来提供更多信息和上下文
Twitter声称,字数更多的推文能吸引更多的用户。这是因为你可以添加更多信息和更多上下文。字数多也可以提供更多的创造力。Twitter算法奖励这样的行为,所以请写更多的字数。确保你的个人资料是可信的
确保您的个人资料是最新的,并且填写了所有的相关信息(名称,简历,位置,链接,照片等)。
该算法更喜欢看起来可信度高的账号,因此不要发垃圾内容,发失效的链接或使用自动化软件。每天都发内容
如果你每天都发推文,为粉丝带来价值,那么算法就会为你带来回报。如果在过去一周中粉丝与你的推文进行了互动,那么算法将会增加你的优先级。与你的粉丝互动
当你转发,@回复其他人,他人回复你的时候,算法会在他们的时间轴中推荐你的内容(前提是他们关注你)。
与其他Twitter帐户互动可以确保算法将你视为社区的内容创作者。不要只是发推文并期望人们与你互动——你需要主动与他人互动。Instagram算法尽管Instagram不如Facebook算法出名,但Instagram无疑是最酷的社交媒体算法,也是未来最重要的算法,因为Instagram逐渐成为改变消费者文化的中坚力量。毫无疑问,Instagram是最热门的社交媒体平台,而且热度可能还会持续一段时间。它改变了整个行业,例如时装业中,著名时尚杂志(如Vogue)不再硬性规定其中应该出现的内容和不应该出现的内容。现在,它已经成为人们变身KOL的主要平台,因为Instagram的创作过程比任何其他社交平台都容易得多。数据显示出持续上升的趋势,这意味着Instagram的网红营销正在蓬勃发展。Instagram是时尚,健身,旅行,游戏,宠物甚至CGI KOL等各行各业KOL们的家园。只要你使用Instagram工具和软件,有足够的才干并投入工作,任何人都可以成为“ins明星”。不过,像其兄弟网站一样,Instagram最近也出现了负面新闻,不过和Facebook相比还差得远。1 / KOL骗局对于新手来说,有很多人尝试欺骗Instagram算法,使自己看起来比实际上更有影响力。人们使用机器人和代理服务来自动关注或取消关注他人帐户,用机器人来点赞或对他人内容进行评论,这种情况在Instagram上比比皆是。这并不是真正的粉丝关系和互动参与,而是一种对系统的操纵。Instagram似乎对此无能为力。更糟糕的是,购买假粉和假互动来夸大其粉丝数量,这种情况在Instagram上也很盛行。从第三方网站上购买几千个粉丝只需很少的费用(5-10美元),用相似的价格,还可以让“人们”点赞并评论你的内容。在这种情况被整顿之前,许多假KOL会以此来欺骗品牌和代理商与他们合作,为他么花钱。从长远来看,这些假KOL们肯定会被发现,因为品牌的投资回报率并不符合KOL们所展现出的影响力。2 / 从时间轴到Instagram算法的转变Instagram于2016年中宣布了自己的社交媒体算法,旨在为用户提供他们最希望参与的内容类型。在上线nstagram算法之前,信息流按时间顺序发布,这意味着你可以在页面顶部看到最新的帖子。当时,新帖的生命周期为72分钟;但现在,它在发布几天之后仍可以获得互动。现在,在重新登陆instagram后,你可以在时间轴中看到上次登录时你互动最多的人发布的内容。参与度是Instagram算法的关键排名因素。内容所收到的点赞,评论,评论点赞,内容收藏,DM回复和通过DM发送的次数越多,算法对其赋予的权重就越大。3 / 我们对Instagram算法了解多少?首次发布时,内容会被推荐给一个特定的粉丝群,以评估参与度其中的三个重要因素是:1.兴趣(Instagram算法认为你喜欢该内容的可能性越高,你看到它的可能性就越大);2.时间轴(优先推荐最近发布的帖子);3.关系(如果你为某些帖子点很多赞,并发表很多评论,算法会把你认定为这些账号的朋友和家人)定期发布将有助于你在用户的时间轴中得到更高的权重,并且算法不会降低发布次数过多的人的权重算法并不偏好使用Stories,直播或其他特殊功能的用户通过DM分享的帖子会被算法排名评论的权重比仅点赞的权重更高使用不多于30个话题标签来优化内容,这样更容易被用户发现。不过每个内容不应该用相同的话题。你互动越多的内容将获得更高的曝光率主题标签仍在算法中起作用,但主要只在“浏览”页面中发挥作用一个拥有好的建设且参与度高的社区可以提高每份内容的积分积极地与他人的内容进行互动(通过点赞和评论)有助于引流自己的内容,并进一步提高自己账号的参与度用户在内容上花费的时间越长,该内容的算法积分就越高4 / Instagram算法排名因素——5 / 如何适应Instagram算法?定期发布
如果你发帖不规律,算法会将你视为流量玩家,不会在粉丝中优先推荐你的内容。而那些定期发布并贡献最大的人将获得算法的青睐。与特定内容进行互动
与那些和你的Instagram账户相关的用户和内容进行互动,可以帮助你引流自己的账户。你与他们互动的越多,你的内容在他们时间轴中的算法权重就越高。在最佳时间发布内容
Instagram算法的三个关键因素之一是及时性。首先了解何时是你的最佳发布时间,然后发布内容。使用话题标签,这样用户就可以通过“搜索”页面找到你
通过使用话题标签,如果你能获得搜索页面的头部位置的话,它可以为你带来数百甚至数千的点赞和粉丝。YouTube算法由于平台太过流行,导致YouTube算法可能是当今最难破解的社交媒体算法之一。YouTube拥有15亿全球用户,从数据上说,它是世界第二大搜索引擎,是一个需要认真应对的平台。开发YouTube算法的目的是服务对网站做出重大贡献的用户。这反映在它的一些排名因素上,这些排名因素基于坚持发布和用户拥有的粉丝数量来制定的。除非您是知名人士,拥有某种特别出众的才华,或者在制作视频方面拥有与众不同的角度,否则,想从零开始在YouTube上吸引大量粉丝,需要投入大量的工作。为什么?因为Youtube上的内容质量非常高,并且这些内容涵盖了每个可以想到的主题。最重要的是,它需要每周发布约2/3次才能获得算法的青睐。这就是为什么YouTube SEO是一个蓬勃发展的行业的原因,许多像Brian Dean这样的 “传统” SEO专家也开始注重并磨练他们在YouTube平台上的技能。1 / 推荐算法与儿童安全在过去的几年中,YouTube的推荐算法遭到了抨击,因为有关儿童的视频中出现了问题评论,算法还自动填充恋童癖相关的内容。。这导致许多主要品牌暂停在YouTube上投放广告,除非问题得到解决。在撰写本文时,由于类似问题的再次发生,YouTube算法正处于风暴中心。像Google / Alphabet和Facebook这样数十亿美元的公司并没有完全控制自己的社交媒体算法的使用。你是否会感到担心呢?2 / KOL强烈反对YouTube算法测试2018年5月,许多YouTube上的KOL对平台进行的算法测试感到愤怒,该平台向用户推荐了他们尚未订阅的频道的视频,而不是已经订阅的频道视频。YouTube表示,它只对一小部分用户进行了测试,但一些YouTube明星对此感到恼火,并公开表示反对这种行为。这是一个值得牢记的教训。用户——即使是最有影响力的用户——在任何社交媒体网站上都无法完全控制自己的频道或内容,他们也永远得不到这个权利。他们拥有的是一块租来的土地。3 / 我们对YouTube算法了解多少?总观看时间和观众留存是重要的排名因素上载频率是一个重要因素,持续上传的人会得到算法的青睐可以用一个面向小部分用户的帖子来测试初始参与度粉丝越多,YouTube算法对你的视频的优先级就越高视频的观看次数越多,YouTube算法的优先级越高频道的观看次数越多,YouTube算法的优先级越高视频的点赞/踩和评论是重要的排名因素标题,描述和关键词标签是重要的排名因素视频的最佳长度是7-16分钟YouTube算法是人工智能,它正在不断地学习,理解人类并拓展4 / YouTube算法排名因素——5 / 如何适应YouTube算法?持续性是关键
如果断断续续的更新频道中的内容,那么算法会降低 该频道的权重。所以你最好持续发布内容,最好在每周的同一时间发布,也可以每天发布。
这不仅能从算法角度为你提供帮助,而且知晓更新时间会让你的粉丝更乐于观看你的视频。建立粉丝基础
频道中的粉丝数越多,你在算法中的积分就越高。但这对于从零开始以及希望发展Youtube账号的新手来说是一个左右为难的规则。让你的目标受众喜欢你的视频
你应该这样做,而且你获得的点赞越多,算法给予你的权重越高。制作一些讨你的目标受众欢心的视频,并注意不要出现争议性内容,这样会导致负面评价。在视频的前几分钟内勾住观众
YouTube算法认为,人们观看视频的时间越长,你的内容就越有趣。所以你的目的是勾住观众,许多YouTube博主会使用特定的策略来勾住观众。视频时长应在7-16分钟之内
马特·吉伦(Matt Gielen)发现,时长7 – 16分钟的视频具有最佳的用户留存率,最高的参与度和最佳的观看者订阅率。解码社交媒体算法需要集体努力
社交媒体正在不断进行A / B测试并更改其算法,以适应新功能,增加收入并为用户提供更多价值。结语尽管我们永远不能完全了解每种社交媒体算法的内部工作原理,但我们可以从公司的公开资料中获取线索,并相应地调整我们的方法。
我们可以通过自己的经验,和他人相互分享经验,逐一地解码社交媒体算法。使用信息碎片,基本假设,一些常识,不断测试和数据共享,可以破解这些神秘的数学方程式。就像SEO行业诞生于破解搜索引擎算法的集体愿望,我们也可以共同努力,以了解这些正在塑造社会文化的强大社交媒体。这意味着我们要不断地测试内容来发现有效的方法,无效的方法以及出现这两种情况的原因。此外,在社交媒体传播方面,我们不仅需要速度和敏捷性,还需要知识和经验的集体共享,需要KOL们集体对社交媒体公司施压,迫使他们提供更多有关这些神秘算法的内部工作原理的信息。因为算法对我们所有人的生活将产生更大的影响。

黑客正传播可劫持社交媒体账户的恶意软件
近日,瑞典、保加利、俄罗斯、百慕大和西班牙的5000多台Windows设备被一种能够控制社交媒体帐户的新恶意软件感染,它主要通过微软的应用商店以计算机木马游戏应用程序的形式入侵。这种新型恶意软件是一种典型的网络病毒,它以隐蔽的方式进入到目标设备,对目标设备中的私密信息进行收集和破坏,再通过互联网,把收集到的私密信息反馈给攻击者,从而实现其目的。以色列网络安全公司Check Point将这恶意软件称为“Electron Bot”,目前攻击者的身份尚不清楚,但有证据表明他们可能来自保加利亚。Check Point的Moshe Marelus在本周发布的一份报告中表示:“Electron Bot是一种模块化的SEO毒害恶意软件,用于社交媒体推广和点击欺诈,它主要通过微软商店平台传播,并在数十个受感染的应用程序中散播,这些应用程序由攻击者不断传播。”2018年10月第一次发现该恶意软件活动迹象始于广告点击器活动,恶意软件假装自己是Google相册的一部分,但实际上是一个广告点击器,可以反复打开Windows 10中的隐藏广告。往后几年,该恶意软件经历了多次更新,开创并提供了新功能和规避功能。除了使用跨平台Electron框架之外,该恶意软件还可以在运行时加载从C2服务器获取的有效负载,使其难以被发现。Marelus解释说:"这使得攻击者能够在任何时间修改恶意软件并控制修改你的电脑"。Electron Bot的主要功能是打开一个隐藏的浏览器窗口,以感染SEO,产生广告点击量,将流量引导到YouTube视频网站和SoundCloud语音录制托管的内容页面,并推广特定产品提高广告点击量、提升商店评级以获得更高的销售额,从中赚取利润。最重要的是,它还具有可以控制Facebook,Google和Sound Cloud上的社交媒体帐户的功能,包括注册新帐户,登录、评论和点赞其他帖子以增加观看次数。在此过程中,在木马程序继续获取实际的恶意软件之前,可以利用来自卡巴斯基实验室、ESET、诺顿安全、WebrootSophos和F-Secure等公司的软件采取一些步骤来识别潜在威胁检测软件。推送带有恶意软件的应用程序的游戏发行商列表如下:Lupy游戏
疯狂4游戏
Jeuxjeuxkeux 游戏
阿克什游戏
GOO游戏
Bizzon CaseMarelus指出:“由于在每次运行时恶意软件的有效负载都是动态加载的,攻击者可以修改代码并将恶意软件的行为更改为高风险,例如,他们可以初始化并释放新的恶意软件,如勒索软件或RAT。所有这些都可以在受害者不知情的情况下发生。”参考来源https://thehackernews.com/2022/02/social-media-hijacking-malware.html

2015年中国社交媒体核心用户数据分析
来源:媒介360(微信ID:imedia360)2015年可能要载入中国媒体发展史。因为,这一年,中国用户花费在数字媒体上的时间已经过半,一举超过传统媒体。伴随而来的是广告进一步从传统媒体转向新媒体。网络媒体成为第一大广告收入媒体,未来网络广告尤其是移动广告的收入份额将继续增长。
目前,社交媒体依旧是新媒体中最为活跃且最有发展潜力的领域。2015年,在数字媒体用户使用时长首超传统媒体的大背景下,社交媒体也表现出了自己独特的平台发展属性和用户使用习惯变化。以下,媒介360综合了凯度发布的《2015中国社交媒体发展报告》、腾讯企鹅智库发布的《2015年微信平台数据研究报告》和新浪发布的《2014年微博用户发展报告》,为大家描绘出2015年社交媒体发展的大致轮廓。中国用户各类媒体花费时间据eMarketer的最新报告,2015年中国用户所有媒体每天总用时为6小时08分。其中:数字媒体每天花费时间已达3小时05分。传统电视每天用时下降到2小时40分,收音机下降为11分钟,印刷媒体下降为11分钟(报纸下降为10分钟,杂志下降为1分钟)。各类媒体的渗透率2015年,在18岁及以上中国成年人中,传统电视的渗透率达94.8%,遥遥领先于其他媒体。但使用时间却呈缓慢下降趋势,这表明电视的开机比率在逐步走低。PC端互联网用户的渗透率为46%,智能手机用户的渗透率为43.1%,非智能手机用户的渗透率为42%。印刷媒体(报纸与杂志),其2011~2015年复合年均增长率(CAGR)为-7.4%,其中报纸CAGR为-5.1%,杂志CAGR为-7.4%。相比而言,杂志比报纸更惨。社会化媒体数据全览根据凯度发布的《2015中国社交媒体发展报告》,社交媒体用户呈现快速增长态势,日趋主流。社交媒体用户在城市居民中的百分比已经从2013年的28.6%上升到2014年的34%。社交媒体用户年龄结构呈现多元化:90后成为最大人群,70、60、50后份额均呈现不同幅度的增长。社交媒体用户地域分布呈现多元化:一线城市比例下降,二三四线城市均有不同程度的增长。社交媒体用户受教育水平呈现多元化:高等学历比例小幅下滑,初等学历比例上升。移动社交成为主流趋势,移动属性的媒体更受社交媒体用户青睐。不同代际社交媒体用户的网络行为如下:目前,微信已经超越QQ空间成为网民使用最多的社交应用。2013年微博在原创方面占据优势,2014年则是微信全面领先。社交媒体用户互动减少,单纯浏览信息的比例继续提升。社交用户的目的性在减弱,获取新闻资讯、分享心情以及获取实用信息依然是大家使用社交媒体的主要诉求。并且,社交媒体用户更加注重社交中隐私的保护,减少互动。微信根据腾讯发布的《2015年微信平台数据研究报告》,微信Wechat合并月活跃用户数超过4.68亿。微信使用人群中,男女用户比例64.3% :35.7% (约1.8:1),用户以男性为主。微信用户普遍年轻,平均年龄在26岁。97.7% 的用户在50岁以下。86.2%的用户在18-36岁。绝大部分微信用户的职业来自:企业职员、自由职业者、学生、事业单位员工这四类职业。微信已成为人们生活的重要部分。25%的微信用户每天打开微信超过30次。55.2% 的微信用户每天打开微信超过10次。微信作为中国微信用户强大的社交工具,接近一半活跃用户拥有超过100位微信好友。62.7%的微信用户的好友超过50人。微信直接带动的生活消费规模已达到110亿元(US$1.76),其中娱乐消费时最大支出,规模为58.91亿元(US$943)。各部分比例分别为:娱乐53.6%;公众平台20.0%;购物13.2%;出行11.3%;餐饮2.0%。公众号是微信的主要服务之一,近80%用户关注微信公众号。企业和媒体的公众账号是用户主要关注的对象,比例高达73.4%。微信公众号的用户关注比例:29.1%自媒体;25.4%认证媒体;20.7%没有关注;18.9%企业商家;5.9%营销推广。用户关注公众号主要目的是获取资讯41.1%,其实是方便生活36.9%和学习知识13.7%。微信热门订阅号按内容分类中,娱乐,健康生活,新闻资讯以及美容时尚类订阅号占据了80%的份额。除日常发帖,42%的订阅号还会通过微社区或微讨论功能与粉丝互动。其中,娱乐类内容最受微信用户的追捧。微博根据《2014年微博用户发展报告》,截止2014年9月30日,微博月活跃用户数(MAU)已经达到1.67亿人。微博用户年龄结构较为均衡:从月活用户的年龄比重上看,19-35岁用户占月活跃用户总量的72%,80、90后为微博活跃用户主体,且年轻化用户有较为明显的增长趋势。微博月活跃用户群中,男性用户占比较大,达60.9%,女性用户占39.1%。从省份分布上不难看出,北上广以及江浙一带用户分布较为密集,从地区分布上看,华东、华南地区微博活跃用户较多。高粘性用户数量占比持平,总量增加:从整年用户登陆情况来看,全年月均登陆天数在15天以上的高粘性用户占比较2013年相比基本持平为32.11%。低粘度用户占比比重大幅降低:登陆一日的用户占比大幅下降,微博用户整体粘性依然保持较好的上涨态势。微博用户每日发布的博文数据中不难看出,微博用户发布博文行为主要集中于一般用户活动时间内(6点至24点间),而博文发布的最高点位于晚间时分,其中22-23点间为用户发布博文的最高时段。根据《2015中国社交媒体影响报告》,网民在微博上除了热衷于讨论娱乐和社会舆论类资讯,还注重个人生活类信息的获取和互动。最热门的关键词主要围绕娱乐及社会舆论类话题。娱乐类关键词如热门电视节目,明星,网络视频站点等。社会舆论类关键词如环境,安全,违法等。结语2015年,在“互联网+”行动计划的推动下,新媒体加速向全产业渗透。而社会化媒体是这个浪潮中的代表之一,也是不容忽视的一股力量。一场从线上和掌心开启的变革浪潮,正在深刻地改变我们生活和生产力的方方面面,这当中,社会化媒体已经建立了强大的影响力和生态粘合力,而其对于新领域的探索也一直未有停歇。

一款基于 Spring Boot 的现代化社区(论坛问答社交网络博客)
推荐一个不错的论坛类开源项目!
这个项目叫做「forum-java」,是一款用 Java(spring boot) 实现的现代化社区(论坛 / 问答 / BBS / 社交网络 /博客)系统平台。forum-java 是一个开源的现代化社区平台,它实现了:面向内容讨论的论坛面向知识问答的社区100% 开源关注公众号“武哥聊编程”,好的项目分享给大家
forum-java 功能列表图片forum-java 特性前端:多终端适配(手机端,pc端)自定义主题颜色,方便企业用户自定义主题编辑器支持 control + s 保存编辑器支持 control + v 复制图片上传后端:日志带有调用链,方便排查问题分布式 session,支持集群部署用户角色权限分级,便于用户管理接口权限校验,接口操作更安全可扩展功能接口:文章/问答更新时自带审核,可接入审核中心便于运营管理文件存储抽象接口,可支持自定义接入企业内部文件储存服务缓存服务抽象接口,可支持自定义接入企业内部缓存服务搜索服务抽象接口,可支持自定义接入企业内部搜索服务forum-java 技术栈后端:数据库:mysql持久层框架:mybatis数据库连接池管理:hikaricp数据库分页插件:github pagehelpermvc框架:spring mvc应用层容器:spring bootjson 序列化工具:fastjson邮件发送 sdk:javax mail七牛云存储 sdk:qiniu java sdk服务端页面渲染:thymeleaf前端:前端 markdown 编辑器:mavon-editor管理后台 js 框架:vue用户端 UI 框架:bootstrap管理后台 UI 框架 iviewforum-java 页面展示图片图片图片图片

美国正考虑禁止中国社交媒体APP,据称TikTok在名单中
新智元报道 来源:reuters编辑: 永上【新智元导读】据路透社报道,美东时间6日晚间,美国国务卿迈克·蓬佩奥表示,美国正考虑禁止中国社交媒体应用程序,包括抖音海外版TikTok。路透社消息,美国国务卿蓬佩奥表示,美国正在考虑禁止中国社交媒体APP。蓬佩奥在接受福克斯新闻采访时称:「我不想在总统(特朗普)之前宣布这件事,但这确实是我们在考虑的事。」目前尚无法知道更多消息,双方也未就此问题协商谈判。上周,印度禁止了抖音海外版TikTok等59款中国应用程序,美国国务卿蓬佩奥曾对此表示赞赏,并表示「印度政府此举确保印度自身安全不受威胁。另外,印度拒绝中资参与道路建设,扩大了经济上的抵制中国运动。」蓬佩奥在周三的新闻发布会上说:「我们欢迎印度禁止某些可用于中国监视工具的移动应用程序」,并表示此举能够保护印度主权完整和国家安全。据法新社报道,印度道路交通与高速公路部长加德卡里表示,「印度将不允许中国企业及合资企业参与印度道路与高速公路建设」。这项政策似乎是印度国内抵制中国运动的一部分。参考链接:https://www.reuters.com/article/us-usa-tiktok-china-pompeo/pompeo-says-u-s-looking-at-banning-chinese-social-media-apps-including-tiktok-fox-idUSKBN2480DF

数据挖掘duang duang duang的前世今生 兼谈社交媒体的舆情传播
好像一夜之间,其实就是一夜之间,duang这个词火了,火得一塌糊涂。我们先来看看它火到什么程度。从今天(26日)早9:00-19:00这段时间关键词“duang”在新浪微博的被提及826万次,平均每秒229次,照此速度今天在微博会出现1300万次左右。什么时间开始火的?上图:
可以看得出21号出现变化,22号突变,25号起势,26号爆了!其中26号13:00-14:00是明显的爆点。从百度指数来看23号之前都为0,从23号开始才有人陆续搜索这个词,而新浪的微博指数到目前(26日19:00)还没有收录这个关键词。duang来自哪儿?它来自于一个叫“三次元鬼畜”的网友上传的一段搞笑视频。25日前的所有新浪微博均引用自这个视频地址:http://www.bilibili.com/video/av2023391/ 。视频比较搞笑,同时涉及成龙,又是在春节期间,同时选择了微博作为主传播渠道,传播元素具备,只欠东风。大家先欣赏一下这个视频内容吧:《引爆点》中提到流行三法则:人物法则、附着力因素法则和环境威力法则。我理解就是关键人物,新闻价值,传播渠道。目前还缺关键人物。我们通过时间线来看看关键人物的出场吧。传播关键人物是谁?2月20日16:31 网友三次元鬼畜上传视频到网站16:46 居然有网友开始模仿造句了,应该不是作者本人,因为作者本人会直接放视频的。22:13 该视频第一次被评论,然后开始被热评,可能是网站做了推荐。但是一直到22日前都只是在网站内部火。22:25 视频被第一次分享到新浪微博,于是开始有陆续的分享。2月21日23:18 一个有27万粉丝的账号分享了该视频
不过这条微博的3.7万转发量主要集中在22日和24日。2月22日8:44 一个粉丝有225万的账号分享了该视频。当天有五个粉丝在几万到14万的账号转发了此视频。至此数据开始突变,但是没有很好的持续性,从前面的数据来看23日并没有爆,反而是一个低点。基本可以确定21和22日这两个账号是传播的源头。
2月24日4:38 粉丝52万的@幕斯 转发了21号那条微博,带来6千多的转发量4:52 著名的@使徒子 粉丝452万转发了21日的那条微博,带来5千多的转发量经过二人的转发后,这个视频就广为人知了。等待25日的起势。
2月25日各种大V使劲传播,从单纯的传播视频开始过渡到模仿和恶搞了,于是2015年第一个热词诞生了。18:05 @叫兽易小星 粉丝635万 原创微博被转发4万多次。无数大号转发这条,就不一一列举了。21:03 @斯道 粉丝98万 原创微博被转发18万多次21:09 @我的朋友是个呆B 粉丝693万 原创微博被转发3万多次。22:47 @王尼玛 粉丝379万 原创微博被转发1万多次
2月26日爆了,视频被纷纷上传到各大网站,这是网友欢乐吐槽的一天,主要事件两个。7:39 视频被上传到腾讯视频,播放次数高达900多万次,而源视频也只有175万的播放次数。9:40 “duang”的百度词条被创建,并且一天内被修改了9次。
可能看到这里很多人还是不明白duang的准确定义,看看网友的图片就明白了。接下来如何发展?
1、被各种PR公司利用搞营销2、被各种传播学院分析这种现象3、被主流媒体批驳,大家的无聊,精神的空虚......最后重温这句《引爆点》中提到流行三法则:人物法则、附着力因素法则和环境威力法则。就是关键人物,新闻价值,传播渠道和时间节点的组合。

如何使用SocialHunter爬取网站并寻找可以劫持的社交媒体链接
关于SocialHunterSocialHunter是一款功能强大的网站安全检测工具,该工具可以帮助广大研究人员轻松爬取给定的URL地址,并寻找目标站点中存在安全问题且可能遭受劫持攻击的社交媒体链接。如果一个网站存在这样的链接地址,那么攻击者将有可能利用该链接来执行网络钓鱼攻击。除此之外,这种链接也有可能导致企业或网站的名誉受损。值得一提的是,这种社交媒体链接劫持漏洞也包含在了很多漏洞奖励计划之中。支持的社交媒体平台Twitter
Facebook
Instagram
Tiktok(不需要任何API密钥)工具要求Golang环境工具安装代码下载广大研究人员可以使用下列命令将该项目源码克隆至本地:代码语言:javascript复制git clone https://github.com/utkusen/socialhunter.git源码安装除此之外,我们也可以直接从该项目的【Releases页面】下载预构建的项目代码,或者直接运行下列命令远程获取安装:代码语言:javascript复制wget https://github.com/utkusen/socialhunter/releases/download/v0.1.1/socialhunter_0.1.1_Linux_amd64.tar.gz
tar xzvf socialhunter_0.1.1_Linux_amd64.tar.gz
./socialhunter --helpGo安装该工具基于Go语言开发,因此我们也可以使用go get命令来安装和部署SocialHunter:代码语言:javascript复制go get -u github.com/utkusen/socialhunter工具使用SocialHunter的使用非常简单,我们只需要给SocialHunter提供两个参数,即可执行我们想要的任务。-f参数:指定包含了目标URL地址的文本文件的路径,其中包含待测试的URL地址,每条地址按行分隔。SocialHunter所采取的资源爬取策略为“路径感知”策略,比如说,如果目标URL为“https://utkusen.com/blog”,那么该工具只会爬取“/blog”路径下的页面。-w参数:需要运行的Worker数量,比如说“-w 10”,该选项的默认值为5,我们可以通过增加或减少该参数的值来适配你系统设备的性能。工具演示视频https://asciinema.org/a/wYMVXIHCxxOB3QPWq4Fe8Advn许可证协议本项目的开发与发布遵循MIT开源许可证协议。项目地址https://github.com/utkusen/socialhunter精彩推荐

腾讯多媒体自由视角技术首次亮相中国网媒论坛
11月24日,以“发展与秩序·让大流量澎湃正能量”为主题的2021中国网络媒体论坛在广州举办,来自中央和地方新闻单位、知名互联网企业、县级融媒体中心等43家单位参展。论坛包括开幕式、5场平行论坛、“同心粤港澳 携手大湾区”网络主题活动,集中展现网络媒体领域的新技术、新应用、新业态,让技术创新为网络媒体发展插上蝶变的翅膀。该论坛是目前我国网络媒体界层次最高、最具权威性和影响力的年度盛会,被誉为观察中国网络媒体发展走向的重要窗口。自腾讯数字生态大会,腾讯自由视角产品首次亮相获得社会各界一致好评后,腾讯多媒体实验室自由视角技术再次受邀,亮相中国网络媒体论坛,与之一同亮相的还有腾讯多媒体实验室与集团公关与市场部通力推出的腾讯妙笔·沉浸式互动水墨画。腾讯展区腾讯妙笔·沉浸式互动水墨画 和 腾讯自由视角腾讯自由视角允许用户通过相应的终端(手机、电脑等)调整屏幕,自由的选择观看角度。在赛事中,例如足球比赛,将相机架设在门框前,可以看到多种精彩的射门角度在重视动作的教学中,学生通过手机可以多角度的查看老师动作细节。现在随着5G网络的普及,我们的网速逐渐变高,视频也逐渐向高清,超高清的趋势发展。自由视角,因为用户可以自由的选择观赏角度,会有大量的视频文件被下载,对设备,和网络都有较高的要求。腾讯自由视角产品,结合腾讯多媒体实验室沉浸式自研技术,为用户打造在多视角切换时能够平滑且低延时切换的体验。腾讯多媒体实验室作为腾讯的核心实验室之一,专注于多媒体技术领域的前沿技术探索、研发、应用和落地,包含音视频编解码、网络传输和实时通信,基于信号处理和深度学习的多媒体内容处理、分析、理解和质量评估,沉浸式媒体(VR、AR、点云等)系统设计和端到端解决方案;同时负责国际国内行业标准制定,包含多媒体数据压缩、网络传输协议、多媒体系统和开源平台等。腾讯妙笔·沉浸式互动水墨画多媒体实验室自研的腾讯沉浸式互动水墨画技术,结合智能水墨画、智能作诗和智能配乐等多媒体算法能力,形成了多模态融合且能互动娱乐的完整技术方案。从“水墨画、绝句诗、中国乐”相结合的形式入手,凭借着在技术上的深入研究和产品能力的积累,成功实现通过用户的简单线条即可生成动态山水诗画的效果,为大家带来丰富的沉浸式体验。在迪拜世博会中国馆官方小程序首发上线。正如人民日报社副总编辑赵嘉鸣所说:“让移动直播、VR全景、虚拟现实、竖屏短视频、互动H5等新技术充分被应用到融媒体报道中。”而这正是腾讯多媒体实验室目前专注的方向。未来,多媒体实验室将在腾讯集团“用户为本,科技向善”愿景与使命的引导下,不断创造更多社会价值,推动科技创新与文化传承,助力各行各业升级,促进社会的可持续发展。请随时与我们联系并分享您的需求:腾讯多媒体实验室[email protected]作者:张意晗编辑:张意晗

一款基于 Spring Boot 的现代化社区(论坛问答社交网络博客)!
推荐一个不错的论坛类开源项目!
这个项目叫做「forum-java」,是一款用 Java(spring boot) 实现的现代化社区(论坛 / 问答 / BBS / 社交网络 /博客)系统平台。forum-java 是一个开源的现代化社区平台,它实现了:面向内容讨论的论坛面向知识问答的社区100% 开源forum-java 功能列表forum-java 特性前端:多终端适配(手机端,pc端)自定义主题颜色,方便企业用户自定义主题编辑器支持 control + s 保存编辑器支持 control + v 复制图片上传后端:日志带有调用链,方便排查问题分布式 session,支持集群部署用户角色权限分级,便于用户管理接口权限校验,接口操作更安全可扩展功能接口:文章/问答更新时自带审核,可接入审核中心便于运营管理文件存储抽象接口,可支持自定义接入企业内部文件储存服务缓存服务抽象接口,可支持自定义接入企业内部缓存服务搜索服务抽象接口,可支持自定义接入企业内部搜索服务forum-java 技术栈后端:数据库:mysql持久层框架:mybatis数据库连接池管理:hikaricp数据库分页插件:github pagehelpermvc框架:spring mvc应用层容器:spring bootjson 序列化工具:fastjson邮件发送 sdk:javax mail七牛云存储 sdk:qiniu java sdk服务端页面渲染:thymeleaf前端:前端 markdown 编辑器:mavon-editor管理后台 js 框架:vue用户端 UI 框架:bootstrap管理后台 UI 框架 iviewforum-java 页面展示