
BBS论坛(十六)
16.登录功能完成(1)front/forms.py代码语言:javascript复制class SigninForm(BaseForm): telephone = StringField(validators=[Regexp(r'1[3578]\d{9}', message='请输入正确格式的手机号码')]) password = StringField(validators=[Regexp(r'[0-9a-zA-Z_\.]{6,15}', message='请输入正确格式的密码')]) remember=StringField()(2)config.py代码语言:javascript复制FRONT_USER_ID = 'FFFF'(3)front/views.py代码语言:javascript复制class SigninView(views.MethodView): def get(self): return_to = request.referrer if return_to and return_to != request.url and return_to != url_for('front.signup') and safeutils.is_safe_url( return_to): return render_template('front/signin.html', return_to=return_to) else: return render_template('front/signin.html') def post(self): form = SigninForm(request.form) if form.validate(): telephone = form.telephone.data password = form.password.data remember = form.remember.data user = FrontUser.query.filter_by(telephone=telephone).first() if user and user.check_password(password): session[config.FRONT_USER_ID] = user.id if remember: session.permanent = True return restful.success() else: return restful.params_error(message='手机号或密码错误') else: return restful.params_error(message=form.get_error())(4)front_signin.js代码语言:javascript复制/** * Created by Administrator on 2018/6/9. */ $(function(){ $('#submit-btn').on('click',function(event){ event.preventDefault(); var telephone_input=$('input[name=telephone]'); var password_input=$('input[name=password]'); var remember_input=$('input[name=remember]'); var telephone=telephone_input.val(); var password=password_input.val(); var remember=remember_input.checked?1:0; zlajax.post({ 'url':'/signin/', 'data':{ 'telephone':telephone, 'password':password, 'remember':remember }, 'success':function(data){ if(data['code']==200){ var return_to=$('#return-to-span').text(); if(return_to){ window.location=return_to; }else{ window.location='/' } }else{ zlalert.alertInfo(data['message']); } } }); }); });(5)signin.html代码语言:javascript复制 <script src="{{ static('front/js/front_signin.js') }}"></script>

BBS论坛(十四)
14.1注册完成跳到上一个页面(1)front/form.py代码语言:javascript复制# front/forms.py __author__ = 'derek' from ..forms import BaseForm from wtforms import StringField from wtforms.validators import Regexp,ValidationError,EqualTo from utils import zlcache class SignupForm(BaseForm): telephone=StringField(validators=[Regexp(r'1[3578]\d{9}',message='请输入正确格式的手机号码')]) sms_captcha=StringField(validators=[Regexp(r'\w{4}',message='请输入四位短信验证码')]) username=StringField(validators=[Regexp(r'.{3,15}',message='用户名长度在3-15位之间')]) password=StringField(validators=[Regexp(r'[0-9a-zA-Z_\.]{6,15}',message='请输入正确格式的密码')]) password2=StringField(validators=[EqualTo('password',message='两次输入的密码不一致')]) graph_captcha=StringField(validators=[Regexp(r'\w{4}',message='图形验证码不正确')]) def validate_sms_captcha(self,field): # 必须传入的参数self,field # 使用fields.data和使用self.sms_captcha.data是一样的 sms_captcha=field.data telephone=self.telephone.data if sms_captcha != '1111': sms_captcha_mem=zlcache.get(telephone) if not sms_captcha_mem or sms_captcha_mem.lower() != sms_captcha.lower(): raise ValidationError(message='短信验证码错误') def validate_graph_captcha(self,field): graph_captcha=field.data if graph_captcha != '1111': graph_captcha_mem=zlcache.get(graph_captcha.lower()) if not graph_captcha_mem: raise ValidationError(message='图形验证码错误')(2)utils/safeutils.py代码语言:javascript复制from urllib.parse import urlparse,urljoin from flask import request def is_safe_url(target): ref_url = urlparse(request.host_url) test_url = urlparse(urljoin(request.host_url, target)) return test_url.scheme in ('http', 'https') and \ ref_url.netloc == test_url.netloc(3)front/views.py代码语言:javascript复制class SignupView(views.MethodView): def get(self): return_to = request.referrer if return_to and return_to != request.url and safeutils.is_safe_url(return_to): return render_template('front/signup.html', return_to=return_to) else: return render_template('front/signup.html') def post(self): form = SignupForm(request.form) if form.validate(): telephone = form.telephone.data username = form.username.data password = form.password.data user = FrontUser(telephone=telephone, username=username, password=password) db.session.add(user) db.session.commit() return restful.success() else: print(form.get_error()) return restful.params_error(message=form.get_error())(4)front/signup.html代码语言:javascript复制<div class="form-group"> <span style="display: none" id="return-to-span">{{ return_to }}</span> <button id="submit-btn" class="btn btn-warning btn-block">立即注册</button> </div>(6)front/signup.js代码语言:javascript复制$(function () { $('#submit-btn').on('click', function () { var telephone_input = $('input[name=telephone]'); var sms_captcha_input = $('input[name=sms_captcha]'); var username_input = $('input[name=username]'); var password_input = $('input[name=password1]'); var password2_input = $('input[name=password2]'); var graph_captcha_input = $('input[name=graph_captcha]'); var telephone = telephone_input.val(); var sms_captcha = sms_captcha_input.val(); var username = username_input.val(); var password = password_input.val(); var password2 = password2_input.val(); var graph_captcha = graph_captcha_input.val(); zlajax.post({ 'url': '/signup/', 'data': { 'telephone': telephone, 'sms_captcha': sms_captcha, 'username': username, 'password': password, 'password2': password2, 'graph_captcha': graph_captcha }, 'success': function (data) { if (data['code'] == 200) { var return_to = $('#return-to-span').text(); if (return_to) { window.location = return_to } else { window.location = '/' } } else { zlalert.alertInfoToast(data['message']); } }, 'fail': function () { zlalert.alertNetworkError(); } }); }); });

DeveMobileEaseMobile 主题双双更新1.1,增加离线存储,社交媒体关注等功能
发布约一周,DeveMobile 、EaseMobile 主题迎来更新1.1 版本更新。1.1 版本为主题增加了HTML5 的离线存储(脱机API)功能及国内常见社交媒体关注功能,并修复若干bug。已购用户请待推送或通知。主题更新内容:0、【EaseMobile 】修复EaseMobile 主题与微信机器人插件的冲突问题;评:上一版本在与 我爱水煮鱼 的微信机器人高级插件共同启用时候会有冲突导致主题不能正常运行,本次更新修复这个问题了。请EaseMobile 主题与微信机器人插件的重叠用户尽快更新。1、【DeveMobile/EaseMobile 】增加HTML5 的离线存储功能;评:HTML5 的离线存储功能其实就是让你在脱机的时候仍然可以运行网页,当然前提是网页在线的时候已经被访问过了;如果作为Web APP,这个功能非常人性化;当然,因为涉及到兼容性的问题,默认关闭(可在主题设置开启)。2、【DeveMobile/EaseMobile 】社交媒体关注组件;评:在侧边栏导航上部会显示出这些社交媒体的logo(暂时有新浪微博、腾讯微博、微信、人人、豆瓣),如果访客点击就会去相应的账户页面。你所要做的是在主题设置那里添加你的社交媒体账号地址。默认也是关闭(可在主题设置开启)。3、【DeveMobile】导航栏上针对交互上做了一些修改,提高用户体验;评:具体而言是如果子菜单过长会自动显示滚动条并上下拖动;其他若干内容。4、【DeveMobile】评论处时间改为 “xxx前”的形式;评:据说这个比较好看。 5、【DeveMobile 】优化在微信内置浏览器的的样式显示;评:微信内置的浏览器不是一般地渣,目前仍然有一些微信内置浏览器显示的bug 还没有修复。6、【DeveMobile/EaseMobile 】优化在ipad 等平板设备上的样式显示;评:在平板上空间更大,所以一些空白处稍微增大了。7、【DeveMobile/EaseMobile 】其他或大或小的bugs 修复、细节改进。关于主题降价的决定两款移动主题本来说明天后就升价为119 人民币的,不过考虑到可能因为价格定得太高没有卖出几份 o(╯□╰)o ,加上目前主题仍然处于不完善的阶段(功能上还是较少),所以决定暂不升价了,暂时维持109 的售价——所谓的“主题降价”就是如此。以后等完善了再升价也不迟。接下来主题更新是打算区域差异化UI,毕竟现在两款主题的UI 上还是挺接近的,功能上的差异已经有了,但界面设计上Jeff 也打算差异化——不然很多人都以为两款主题只是换了颜色而已。但,一切还要慢慢来。

用JAVA的DEA算法衡量社交媒体页面的流行度
Measuring the Social Media Popularity of Pages with DEA in JAVA原文作者:Vasilis Vryniotis原文地址:http://blog.datumbox.com/measuring-the-social-media-popularity-of-pages-with-dea-in-java/译者微博:@从流域到海域译者博客:blog.csdn.net/solo95用JAVA的DEA算法衡量社交媒体页面的流行度在前面的文章中,我们讨论了数据包络分析(Data Envelopment Analysis)技术,我们已经看到它如何被用作一个有效的非参数排序算法。在这篇博文中,我们将开发出一个JAVA数据包络分析的实例,我们将用它来评估网络上的网页和文章的社交媒体流行度。该代码是开源的(在GPL v3 license下),您可以从Github免费下载。更新:Datumbox机器学习框架现在是开源的,可以免费下载。查看包com.datumbox.framework.algorithms.dea以查看Java中Data Envelopment Analysis的实现。数据包络分析在JAVA中的实现代码是用JAVA编写的,可以直接从Github下载。它是根据GPLv3许可的,所以可以随意使用它,修改它,或者再分发。该代码实现了数据包络分析(Data Envelopment Analysis)算法,使用lp_solve库来解决线性规划问题,并使用Web搜索引擎优化分析(Web SEO Analytics )索引提取的数据,以构建基于Facebook,Google Plus和推特上分享的一个混合的社交媒体页面流行度矩阵。在前面的文章中介绍了算法的所有理论部分,在源代码中可以找到关于其实现的详细的javadoc注释。(原博文之后数据包络分析(Data Envelopment Analysis)算法及其实现全部简称了DEA,请读者注意,译者注。)下面我们提供一个关于其架构实现的高级别描述:1. lp_solve 5.5 library为了解决各种线性规划问题,我们使用一个名为lp\_solve的开源库。某些特定的lib是用ANSI C编写的,并使用JAVA包装来调用库方法。因此,在运行代码之前,您必须在您的系统上安装lp_solve。该库的二进制文件在[Linux和Windows都可以使用,您可以在lp_solve文档中阅读更多有关安装的信息。在尝试运行JAVA代码之前,请确保您的系统上安装了(相关的)特定库。有关安装和配置库的任何问题,请参阅lp_solve文档。2.DataEnvelopmentAnalysis Class这是DEA算法的主要实现类。它实现了一个名为estimateEfficiency()的公共方法,它获取记录的Map并返回它们的DEA得分。3. DeaRecord ObjectDeaRecord是一个特殊的对象,用于存储我们记录的数据。由于DEA需要分离输入和输出,因此DeaRecord对象将以DEA可以处理的方式分别存储我们的数据。4. SocialMediaPopularity ClassSocialMediaPopularity是一个应用程序,它使用DEA来评估社交媒体网络上Facebook的like,Google的 +1和twitter的Tweets的网页流行度。它实现了两个受保护的方法:calculatePopularity()和estimatePercentiles()以及两个公共方法loadFile()和getPopularity()。calculatePopularity()使用DEA实现根据社交媒体计数来估计页面的得分数。estimatedPercentiles()方法获取DEA分数并将其转换为百分位数。总的来说,百分比比DEA分数更容易解释; 因此当我们说一个网页的流行分数是70%时,这意味着该网页比70%的其他网页更受欢迎。为了能够估计一个特定页面的流行度,我们必须有一个包含其他页面的社交媒体数据的数据集。这是有原因的,因为需要预测哪个网页是受欢迎的,哪些不是,您必须能够将其与网络上的其他页面进行比较。为此,我们使用来自以txt格式提供的Web SEO分析索引的小型的匿名样本。您可以通过从网页上的更多页面提取社交媒体计数来构建自己的数据库。(社交媒体计数,比如点赞数、转发数、评论数)loadFile()方法用于加载DEA的上述统计信息,getPopularity()方法是一种易于使用的方法,可以获取Facebook的like,Google的+1和一个页面的Tweets数量,并以此评估其在社交媒体上的流行度。如何使用数据包络分析的JAVA实现在DataEnvelopmentAnalysisExample类中,我提供了2个不同的关于如何使用代码的例子。第一个例子直接使用DEA方法来根据它们的输出(ISSUES,RECEIPTS,REQS)和输入(STOCK,WAGES)来评估组织单位的效率。这个例子来自DEAzone.com的一篇文章。代码语言:txt复制Map<String, DeaRecord> records = new LinkedHashMap<>(); records.put("Depot1", new DeaRecord(new double[]{40.0,55.0,30.0}, new double[]{3.0,5.0})); //...adding more records here... DataEnvelopmentAnalysis dea = new DataEnvelopmentAnalysis(); Map<String, Double> results = dea.estimateEfficiency(records); System.out.println((new TreeMap<>(results)).toString());第二个示例使用我们的社交媒体流行度应用程序,通过使用来自社交媒体的数据来评估页面的流行度,例如Facebook的like,Google的+1和Tweets。所有的社交媒体计数都被标记为输出,我们传递给DEA一个空的输入向量。代码语言:txt复制SocialMediaPopularity rank = new SocialMediaPopularity(); rank.loadFile(DataEnvelopmentAnalysisExample.class.getResource("/datasets/socialcounts.txt")); Double popularity = rank.getPopularity(135, 337, 9079); //Facebook likes, Google +1s, Tweets System.out.println("Page Social Media Popularity: "+popularity.toString());必要的扩展(上面)所提供的代码只是DEA如何被用作排名算法的一个例子。为了改进其实现,需要进行下面的扩展:1.加速(算法的)实现特定的DEA算法实现会评估数据库中所有记录的DEA得分。由于我们需要解决如同数据库中记录数量那样多的线性规划问题,这使得实现变得缓慢。如果我们不需要计算所有记录的分数,那么我们可以显著地加快执行速度。因此,该算法的小扩展可以使我们更好地控制哪些记录应该被解决掉,哪些只能被用作约束。2.扩大社交媒体统计数据库(这篇文章所)提供的社交媒体统计数据库由来自Web SEO Analytics索引的1111个样本组成。为了能够估计更准确的流行(度)分数,需要更大的样本。您可以通过统计来自网络上更多页面的社交媒体计数来创建自己的数据库。3.添加更多的社交媒体网络该实现使用Facebook的喜欢,Google的+1和推文的数量来评估文章的受欢迎程度。不过,来自其他社交媒体网络的指标可以很容易地被考虑在内。您只需要从您感兴趣的网络中构建一个社交媒体数据库,然后扩展SocialMediaPopularity类来处理它们。关于实施的最终意见为了能够扩展(算法的)实现,您必须对Data Envelopment Analysis的工作原理有一个很好的理解。这在前面的文章中已经介绍过了,所以在继续进行任何更改之前,请确保您阅读了之前的教程。此外,为了使用JAVA代码,您必须在您的系统中安装lp\_solve库(参见上文)。如果你在一个有趣的项目中使用这个实现,那么就给我们一条线索,我们将在我们的博客上展示你的项目。另外,如果你喜欢这篇文章,请花点时间在Twitter或Facebook分享。

论坛报名 | DataFunCon:AI 平台框架论坛
导读DataFunCon是由DataFun主办的线上技术大会,由20余位知名专家学者出品,设置了18场专题分享,有超过80位一线资深技术专家参与分享,汇集了2020大数据、AI领域最新技术实践。本次大会将于7月25-26日,9:30-18:00在线上举行。7月26日,9:00-12:20,由腾讯大数据智能学习团队负责人陶阳宇先生担任出品人的DataFunCon:AI 平台/框架论坛将准时开启,感兴趣的小伙伴和小编一起来了解下吧: 详细介绍: 出品人:陶阳宇 博士腾讯大数据 | 智能学习团队负责人陶阳宇,腾讯专家工程师,目前担任腾讯大数据智能学习团队负责人,支持腾讯广告推荐、金融支付、社交网络等业务场景的算法模型优化、训练与推理服务。他拥有10余年机器学习、大数据、分布式系统领域从业经验,2009年获中国科技大学电子科技专业博士学位。陶阳宇的主要研究方向包括分布式机器学习系统、广告推荐算法、大数据平台等,曾带领团队获得2015年世界排序大赛冠军及2017年中国电子学会科技进步奖。韩堃 博士滴滴 | AI Labs Researcher 分享主题:DELTA 基于深度学习的语言技术平台内容摘要:近年来,随着深度学习的高速发展,语音和自然语言处理有了越来越多的应用,而这些应用都离不开一套优秀的模型训练和部署框架。为此,我们开发了一个基于深度学习的语言技术平台DELTA,它主要基于TensorFlow构建,能同时支持NLP(自然语言处理)和语音任务及数值型特征的训练。整合了包括文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,形成一致的代码组织架构,整体包装统一接口。本次演讲会着重介绍DELTA的基本架构和使用,并也会针对滴滴在用DELTA在语音交互领域所做的工作做一个整体的梳理。听众收益:了解DELTA的架构和使用,并且了解基于DELTA的实际应用方法。新技术/实用技术点:DETLA简介,架构,设计思路,包括多种深度学习模型的训练和使用,文本分类,命名实体识别,端到端文本生成,语音识别,语音情感识别等。嘉宾简介:韩堃毕业于The Ohio State University,2013年在微软研究院实习,主要研究方向为语音处理和机器学习。韩堃于2014年获博士学位,并加入Facebook从事语音,自然语言处理,机器学习等工作。2018年加入滴滴AI Labs,负责语音交互,对话理解等方向的研究与产品。王辉华为 | 开源工程师分享主题:MindSpore简介以及与TVM的联动内容摘要:MindSpore是一套最佳匹配昇腾AI处理器算力,可用于端边云全场景的开源深度学习框架。本次分享我将为您介绍MindSpore的大体框架,及其在WASM领域与TVM项目的联动方案,最后我准备了一个Demo用于展示该方案的成果。听众收益:通过本次分享,您将会对MindSpore框架的介绍和使用有一定的了解;同时会熟悉TVM编译栈和Runtime的大致流程;最后会学习到如何将WebAssembly技术在AI领域进行落地。新技术/实用技术点:WebAssembly技术:WASM是一种为堆栈式进程虚拟机实现定义的二进制指令格式,目前已成为Web领域的事实标准;WASM Kernel Compiler:利用TVM针对单算子的LLVM编译生成WASM文件,并通过WASM Runtime进行WASM算子的加载;WASM Graph Compiler:利用TVM针对网络整图的LLVM编译生成WASM文件,并通过WASM Runtime进行WASM图的加载。嘉宾简介:王辉是一名来自华为的开源工程师,在过去的四年里专注于新领域(人工智能、芯片、云)和开源技术研究。目前负责新型计算运行时(例如WebAssembly技术)研究和MindSpore AI框架的开源社区运营。在此之前,他作为OpenSDS Hotpot项目的PTL与OpenSDS团队一起工作,同时也是OpenStack、OPNFV和Open Service Broker API等社区的积极贡献者。郭跃超腾讯 | 应用研究员分享主题:Angel深度学习在广告推荐训练系统中的实践内容摘要:Angel是腾讯开源的分布式深度学习框架,支持数据并行、模型并行等多种大规模机器学习模型的训练和加速。本次演讲将介绍Angel深度学习在广告推荐中的应用实践,解决广告推荐CV、用户行为等特征模型训练时的多机多卡扩展等加速问题,以及取得的实践成果。听众收益:通过本次分享,您将会对Angel平台,分布式的相关的技术,以及广告推荐模型训练有一定的了解;同时会学习到,一个生产力工具如何进入业务流程中,如何面对实际问题进行反馈调整,并最终产生实际收益的。新技术/实用技术点:分布式模型训练多卡扩展;广告推荐深度特征生产技术等。嘉宾简介:郭跃超毕业于北京大学,主要研究方向是异构加速计算,分布式系统的设计开发和优化,语音/NLP等领域的算法优化等。目前在腾讯主要负责Angel平台的深度学习方面的新技术研究,开发和业务场景的落地应用。吴志华百度 | 资深研发工程师分享主题:飞桨框架和分布式训练技术及其应用内容摘要:飞桨是源于产业实践的开源深度学习平台。本次分享主要介绍飞桨的核心框架、基础模型库、工具组件。并针对分布式训练模块展开详细介绍,带大家深入了解飞桨超大规模深度学习模型训练技术,以及在信息流、广告、搜索等业务场景上的应用。新技术/实用技术点:深度学习训练框架分布式训练技术推荐算法及业务应用嘉宾简介:百度飞桨资深研发工程师,主要负责飞桨分布式参数服务器架构、PaddleRec推荐算法库及其在信息流、广告、搜索等业务上的应用。李晓森腾讯 | 高级研究员分享主题:Angel图计算技术与实践内容摘要:万物互连构成了复杂的网络世界,同时也积累了丰富的图数据,并蕴藏着极大的价值;本次分享将介绍Angel是如何解决图计算中的三驾马车问题——传统图算法/图表示学习/图神经网络,最终助力内部QQ、支付、音乐、安全等业务提升效果。听众收益:图计算的应用场景,以及基于参数服务器的图计算架构,图计算在腾讯业务中的业务实践。新技术/实用技术点:基于参数服务器的图计算架构,图计算中的常用优化方法。嘉宾简介:李晓森 ( hansenli ),硕士毕业于北京大学,腾讯大数据高级研究员,腾讯图计算开源协同项目Owner & PMC,参与Angel图计算项目,专注于图计算在金融支付、安全风控、广告推荐、知识图谱等多个场景的落地。活动报名:识别二维码,免费报名 扫码关注 | 即刻了解腾讯大数据技术动态

微博市值反超Twitter成市值最高社交媒体股 一下科技强力助攻
2016年,新浪微博在短视频、直播、网红等领域持续发力,股价自今年2月以来持续上涨,迈入“百亿美元俱乐部”。就在本周,微博股价一度上涨至53.12美元,市值达113.5亿美元,超过Twitter市值1000万美元,成为全球市值最高的社交媒体。在这次里程碑事件中,旗下拥有秒拍、一直播、小咖秀三款产品的一下科技起到了重要的助推作用。 合作移动视频行业独角兽 微博实现二次崛起摩根士丹利最近发布报告指出,短视频和直播正在推动微博用户增长,从产品形态来看,微博已经变成类似于Twitter+Instagram+YouTube的综合平台,不再是成立之初“Twitter”的模仿者。其中,这个YouTube 的部分就来自移动视频行业独角兽企业一下科技。作为战略合作方,一下科技旗下秒拍、小咖秀、一直播三款产品SDK内嵌到微博中,实现数据互通,三者为微博贡献海量PUGC内容。从移动端看,短视频用户的基数已经超过了社交媒体,新浪微博正是瞄准了短视频行业这一巨大红利窗口。作为国内最大的PGC短视频播放平台,秒拍日均上传视频量达150万,成为微博内容重要提供方;小咖秀带动全民秀演技,在最近的模仿傅园慧采访片段和魔性神曲《PPAP》热潮中,吸引了包括贾乃亮、古力娜扎在内的一众明星参与;一直播自今年5月上线后更是为微博带来爆发式增长,特别是国庆期间同微博一起推出的#带着微博去旅行#活动,由于直播这一新形式的加入,活动相关话题阅读量达168亿次,超过去年近3倍,成为现象级标志性事件。一下科技三款产品视频内容输出对微博用户活跃方面带来的提升显而易见,微博用户活跃度连续九个季度保持30%以上的增长,尤其是在一直播上线后,更是迎来阶梯式上涨。反观产品形态较为单一的Twitter,在过去一年内,流失了500万的月活跃用户,用户增长乏力。(微博与Twitter用户增长对比,数据来源Bloomberg)一下科技助力微博深耕短视频内容 发展网红经济在微博的内容生态和商业生态中,网红已经成为平台流量入口和商业变现的重要一环。“集美貌与才华于一身的女子”papi酱、贱贱的以BOBO头形象传授化妆技巧的艾克里里和在小咖秀里狂飙演技的“华妃娘娘”蒋欣等明星达人,提升了微博的热度。尤其是一直播上线后,加入金币打赏模式,网红们商业变现方式增多了、周期变短了,相应的,网红群体数量也随之变多了、积极性也更高了,各行业、领域之间也开始出现了垂直细化的趋势。网红群体的商业前景很大,微博希望通过类似于MCN的模式将其内化吸收,让网红经济不再野蛮生长,而是遵循一定营运规则和商业规则。在这一领域微博同样与一下科技强强联手,打造业内最大的红人平台。去年底,新浪微博还与一下科技共同拿出1亿美元来帮助短视频原创作者,整合上下游商业链条,并在近期推出“秒拍创作者平台”,“秒拍惠”等平台政策,为更多原创作者提供数据、流量、商业收入、视频制作等方面的资源倾斜,让短视频创作者更垂直化、知识化、圈层化发展,成为打造网红的星工场。明星、行业KOL等头部资源对平台流量具有巨大吸力,微博与秒拍、小咖秀、一直播构成的生态联合体拥有明星、网红、KOL资源是任何其他单一平台都无法超越的。在维护好原有红人关系同时,微博和一下科技也在努力培养“新网红”,于10月初联手上线的“微博校园红人季”活动和即将举行的“V影响力峰会”都是在网红领域打造的明星活动。此外,一下科技也将依托“秒拍+小咖秀+一直播”的生态联合体,为微博输送更多红人血液。微博同一下科技的强强联合,整合了时下最具商业价值的移动视频行业和网红经济,两者所承载的庞大流量不仅使微博提升了用户活跃度,最终实现二次崛起,更是为微博带来了更多的移动用户,并反应在商业变现领域,最终使得此次微博市值首超Twitter。

CVPR禁令出台:审稿期间禁止主动在社交媒体宣传论文!LeCun:阻碍科学交流,简直疯了
新智元报道 来源:Twitter编辑:David【新智元导读】计算机顶会CVPR颁布「社交媒体」禁令,在论文审稿期间,禁止论文作者以任何形式通过社交媒体对论文进行讨论或自我宣传,但Arxiv不在禁止之列。此令一出,社区炸锅,反对者众。对于计算机科学领域的研究人员来说,每年的顶级学术会议,即「顶会」的分量都是毋庸置疑的。 很多时候,准备向顶会提交论文的作者会通过社交媒体,把自己的论文事先做一波宣传。在促进学术交流的同时,也能让更多人了解自己的成果。不过现在,计算机顶会之一的CVPR宣布,从此刻开始,此路不通了。当地时间10月20日,CVPR通过Twitter发布通知,明确规定:提交CVPR的论文在审稿期间,禁止论文作者以任何形式在社交媒体上进行讨论或自我宣传。通知全文是这样的:CVPR 2021 PAMI-TC 会议此前已经通过动议,论文作者在评议期间不应使用社交媒体传播向 CVPR 提交的论文。在动议中定义了社交媒体的沉默期。社交媒体的沉默期从论文提交截止日期前四周开始,直到论文最终结果通知发送给作者的时间。根据目前的时间表,此静默期从 2021 年 10 月 19 日到 2022 年 3 月 2 日。在此期间,任何由作者主动发起的对论文的社交媒体宣传都被视为违反政策。CVPR认为,此项政策有助于保持双盲评审的公信力。「社交网络」禁令6月即已敲定,但Arxiv例外值得注意的是,这次发布的通知中提到,包含这项政策的动议在「此前」已经通过。实际上,这项动议是今年6月在PAMI-TC会议上由计算机科学家、德国马克斯·普朗克智能系统研究所所长 Michael Black 提出的。这份动议认为,现行政策对于投稿作者在社交媒体宣传自己的论文的行为无法有效制约,而且定义含混,只要作者没有明确说明文章处于会议审稿阶段,就允许在社交媒体上宣传。这种宣传愈演愈烈,无疑会影响双盲评审的信度,影响审稿人对文章质量的判断。同时,在社交媒体上拥有众多追随者的大V们会借此获得更大的舆论优势,降低了大众对评审制度公平性的信任,也会影响科学界内部的互信。不过,这份动议把Arxiv排除在了禁令之外,理由是:首先,arXiv 上的论文不是“已发表”,而是“预发表”。这种公开的发表前流程属于一种可以发现问题的社区评议形式,和正式的同行评议很类似。其次,将论文放在 arXiv 上供专家进行早期分析,与在社交媒体上向广大受众公开宣传有很大不同。会议认为,这一新政策并不会减缓科学进步,而且关注Arxiv的大多是专家,而不是普通大众,这与在社交媒体上宣传论文的受众有很大区别。此动议被高票通过。社区炸锅,反对者众,LeCun直呼「疯了」此通知一出,立即引发网友热烈讨论。有Reddit网友表示,这个政策初衷是好的,社交媒体宣传论文泛滥是该治一治了,但是可能解决不了问题。这确实是不错的一步,但实际实行起来很难,因为操作起来可以绕过「主动宣传」的方法太多了。比如,现在的规定只是禁止作者在社交网络上贴出向CVPR送审的论文链接,但如果作者发在Arxiv上,根本不提在CVPR评议的事儿,那就难办了。还有网友表示,这个政策看起来是促进公平,实际上是进一步加剧了不公平。理由很简单,如果作者是大牛,本身就鼎鼎大名,又背靠知名机构,不需要通过社交媒体宣传,其他途径多的是。但对于一般作者,社交媒体不让用了,那可真的没啥别的招了。这个政策会继续拉大「贫富差距」,大机构通过其他方式获得更多关注,小团队和小实验室可能会越来越不为人所知。此处点名Facebook、DeepMind……还有网友认为,说了半天,Arxiv不禁,光禁止社交媒体,这政策漏洞岂不是更大了吗?干脆论文评议改成「单盲」算了。而研究人员方面,对此次禁令的态度以反对意见居多。比如从事机器人、计算机视觉和农业自动化交叉研究的Amy Tabb,早在今年6月此动议通过时,就列出了一份比较详细的观点,系统阐述了她的反对理由。她的主要理由有三: 这项政策会引发寒蝉效应。实际上,向其他科学家和公众公开谈论自己的工作,无论通过哪种媒介都是同样重要的,既包括社交媒体,也包括Arxiv。 那些不遵守规则、喜欢钻空子的人通过媒体推广会得到更多的好处。只要匿名发表就能逃过规则监管,这份动议的规则漏洞太明显。 这项政策的实际效果与设计初衷不符。最终不会限制大型实验室或有大量粉丝的人,遭殃的反而是小型实验室和不知名的研究人员。 她的观点得到了深度学习先驱、图灵奖得主Yann LeCun的支持。LeCun转发了Tabb发表反对意见的推文,认为她的意见是对的。LeCun还表示,CVPR这个政策,限制了科学信息的有效交流和沟通,阻碍了进步,简直是疯了。 不难看出,此次CVPR「禁令」的出台,无论是在动议阶段还是颁布实施,都争议不断。后续实际效果如何,尚待时间检验。 参考链接: https://amytabb.com/tips/2021/06/15/cvpr-motion-position/https://twitter.com/Michael_J_Black/status/1402262709106884610https://www.reddit.com/r/MachineLearning/comments/qbslai/r_cvpr_expands_social_media_ban/?sort=confidencehttps://twitter.com/CVPR/status/1450641549294018560

在社交媒体上,你和ai的区别是,你有多“懒”?
大数据文摘出品来源:frontiersin编译:Fisher、刘俊寰一说到机器人账号,大多数人脑海里第一反应都是水军、控评,如果在国外竞选期间,这些机器人账号还能在社交媒体上被广泛运用于舆论操作中,想来后怕。但是机器人账号也有积极的一面,不少公司将其运用到新闻聚合、在线零售等领域,也着实为人们制造了不少便利。根据2017年的一项调查,Twitter中的机器人数量达4800万,占比15%。在庞大的虚拟AI用户占比和信息爆炸的夹击下,我们如何分辨一个账号究竟是真实的人类,还是虚拟的AI账号?早在1993年,Peter Steiner在《纽约客》刊登了一幅漫画,“在互联网上,没人知道你是一条狗”,被传诵至今。不过现在,我们或许要改一改,“在互联网上,没人知道你是一个AI”。以“懒”识人!随着话题演进,人类用户原创内容递减最近,《物理学前沿》发表了一项新研究,主要研究的正是人类用户和AI用户之间的区别,他们发现人类用户和AI用户并非无法区分。论文指出,人类用户存在短期行为趋势,但机器人账号不存在这类趋势,也就是说,在互联网上人类有着自己的“专属标签”,这恰是关键所在。论文链接:https://www.frontiersin.org/articles/10.3389/fphy.2020.00125/full?utm_source=fweb&utm_medium=nblog&utm_campaign=ba-sci-fphy-physics-ai-bots结果显示,随着话题的演进,人类用户参与社交互动的数量会增加,但是并非表示为增加原创内容,增加的只是转发、回复的比例,以及单条推文中提及话题的次数。与此同时,人类用户原创的内容在减少,推文平均长度呈下降趋势。这些趋势的成因被认为是随着事件发展,人类用户对该话题越来越感到疲劳,更不倾向于做出复杂行为。另一个可能的解释是,随着时间的推移,用户接触到更多的帖子,因此增加了他们对内容做出反应和互动的概率。无论是哪种情况,机器人都被证明不受这些因素的影响,没有观察到它们的行为随时间发生变化。也就是说,区分人类用户和AI用户的关键点在于是否能从他们的推文中察觉到“懒”的痕迹。AI:有被摆了一道的感觉。首次研究AI用户的检测问题值得注意的是,这项研究可用于开发更精准的机器人检测策略,该研究将用户在社交媒体会话中的行为用于机器人检测问题,在同类研究中尚属首次。在这项工作中,研究人员使用一个与近期政治事件相关的大型Twitter数据集,研究了人类账号和机器人账号的行为如何随着某个话题的进展而改变。对这些话题演进的整个过程,研究人员计量了多种因素,以捕捉用户的行为特征,包括参与社交互动的倾向和产生的内容量,然后将这些结果在机器人和人类之间进行了比较。对此,研究人员关注的社交媒体行为包括转发数、回复数和推文中提及话题的次数,以及推文本身的长度。也就是说,他们关注的是能够刻画用户参与社交互动的数量和质量。确定研究标准之后,研究人员将结果用于优化机器人检测系统,观察加入这些新特征后是否能提高检测器的性能。他们使用了一系列机器学习技术对两套不同的分类器进行了训练:一套包含这些新特征,另一套不包含以作为基准。研究人员用这些行为特征来优化机器人检测系统,他们发现包含时间动态特征的完整模型在检测准确性上明显优于未考虑这些特征的基准模型。这些结果凸显了在话题进展的过程中,机器人账号和人类用户之间存在可以计量的行为演变上的差异;同时表明这些差异可以用来实现一个机器人检测系统,或者用来改进现有的系统。“值得注意的是,机器人在不断改进,越来越多地模仿人类在社交媒体上的行为。每当我们发现一个我们以为是人类独有的行为特征,比如在一个账号所关注的话题中体现出的思想情绪,我们会发现,新开发的机器人已经可以体现这些特征了。”论文的共同作者、南加州大学信息科学学院计算机科学助理教授兼研究团队负责人Emilio Ferrara博士说。Emilio强调说,“机器人在不断进化——随着人工智能的快步推进,有可能创造出越来越逼真的机器人,可以越来越好地模仿我们在网络平台上讲话和互动的方式。”“我们在不断尝试发现社交媒体上的人类行为所特有的维度,这些发现又能用来开发更精准的工具以检测机器人。“相关报道:https://blog.frontiersin.org/2020/04/22/whos-a-bot-and-whos-not/

「多媒体与XR圆桌论坛」直播预约已开启!
11月30日,腾讯面向产业互联网领域规格最高、规模最大、覆盖最广的年度盛会——腾讯全球数字生态大会将在深圳国际会展中心正式拉开帷幕。本届大会以「数实创新 ,产业共进」为主题,聚焦数实融合,共设置了50余场行业及产品系列专场,为全球客户及用户分享产业互联网最前沿的产品成果和研讨对话!由腾讯多媒体实验室主办的LIKE.TG多媒体技术专场「多媒体与XR圆桌论坛」将在12月1日14:00-16:00举行,请扫码预约直播。多媒体赛道,作为XR落地产业应用的桥头堡领域,吸引的关注超乎想象。全真互联网时代背景下,用户视觉体验的优劣愈发重要。如何基于低码率高画质、超分等视频处理技术带来的画质提升、三维视频带来的深度感知、任意视点视频带来的用户交互、扩展现实与虛拟现实带来的超现实感,成为业界关注的焦点。为此,本专场邀请到 IEEE Fellow、腾讯杰出科学家、腾讯多媒体实验室负责人 刘杉博士,中国工程院院士、广播电视技术专家 丁文华院士,IEEE Fellow、清华大学计算机科学与技术系教授 温江涛博士,全景声科技创始人、董事长 潘兴德博士,腾讯多媒体实验室扩展媒体中心负责人、国际标准专家 许晓中博士,腾讯在线视频BU播放技术中心总监 朱子荣,共同探讨多媒体与XR的技术前沿趋势。聚焦XR国际标准制定、编解码应用、音视频沉浸式体验以及XR未来畅想,分享腾讯多媒体实验室在此领域的技术积累与战略方向,一同发掘在全真时代与智能时代里多媒体与XR技术的无限可能。圆桌主持人 重磅嘉宾

社交命运的新主宰:AI社交
如果是十年前,在那个没有AI的年代,有人问“社交智能化离我们的生活有多远?”我们只能用未来的态度去审视,在网络不发达的时代,每个人都是一座孤岛,我们期待有一天能通过简单便捷的方式拉近人与人的距离。艾媒数据2019年底发布的调研报告显示,网络社交媒体在中国的渗透率已经高达97%,中国消费者平均每天在手机上花费的时间将近4小时,网络社交媒体平均花费2.3小时以上。如此庞大的用户规模下,社交平台光靠人工后台进行服务是不现实的,这时就需要借助AI技术的帮助。AI入侵社交如今,随着AI技术的发展,社交网络把每个人连接成一个整体的同时,也在越来越智能化,AI已经渗透到社交的各个方面,我们在网络上的每一次社交行为背后可能都有着AI的影子。1.AI对沟通场景的入侵试想一下,你收到一段长达60S的语音消息,但是正处在十分嘈杂的环境里,或者当前不方便听语音,却出于各种原因需要知晓语音内容。这时候你最希望的是什么?可能大多数人的回答是“语音转文字”。微信AI语音识别技术的出现成功解决了“语音骚扰”这一痛点。语音识别技术还包括语音转文字、语音和文字翻译、录音文件识别等等,在这些便捷的功能背后,是微信AI技术基于深度学习理论自研的语言识别技术,而这个技术还可以实现在不同场景,对不同的语言进行识别和翻译。智能化社交的初衷是优化产品的功能和提升用户的体验,以此来提升用户对于产品的满意度。语言识别技术成功降低了不同国家和不同语言的用户交流的门槛,让沟通变得更加简单。随着数字化时代的发展,“AI+社交”可能会成为普遍的趋势,并且功能将越来越多样化。2.AI对匹配场景的入侵与微信专注的熟人社交场景不同,SOUL APP属于陌生人社交领域,AI就好比中介,它连接着所有用户,把每个用户的信息都放在一个数据容器里,当用户启动匹配按钮的时候,AI就会从巨大的数据里找到在做同样事情的人,将标签信息进行匹配,把匹配度最高的人推荐给对方。AI技术在陌生人社交软件的应用解决的是效率问题,一方面节约了用户的交友成本,根据智能化的匹配方式提升了用户的使用体验,有利于增加用户对产品的粘性。另一方面,AI技术有利于社交软件对用户需求进行细分,建立不同的用户画像,智能化细分有利于社交软件降低收集数据的难度,产品可以根据不同的用户画像,开发更多的功能。3.AI对产品玩法的颠覆还记得那款一夜爆火的AI换脸软件“ZAO”吗?在ZAO上,用户只需要进行简单的人脸识别,不需要用户拍摄视频便可以实现一键换脸,简单的操作背后依赖的是庞大的数据库和AI算法。“AI换脸”的爆火背后,笔者看到的是AI技术从“专业化”走向“平民化”的一次勇敢尝试。一方面,AI技术满足了用户对于技术的好奇心,丰富了社交软件的娱乐性,让用户体验到AI技术带来的乐趣,感叹AI还能这么玩!另一方面,AI给予企业在社交功能开发方面足够多的想象力,或许在未来,专业化的技术经过合理简化应用于社交软件,会诞生出更多的“爆款”。智能社交并不完美如今的社交软件离不开AI技术的支持,但是随着AI技术在社交软件领域的应用越来越广泛,也衍生出了各种各样的问题。1.过高的门槛。如今是数字化时代,许多社交产品都朝着智能化的方向发展,社交软件也不例外,AI技术的发展关系企业的未来。比如腾讯创立的腾讯AI Lab实验室,目前其在中国和美国有70位世界级科学家及300余位经验丰富的应用工程师。腾讯公司2019年的财报显示,其研发产生的开支为303.87亿元,由此可见,技术的探索不仅仅是要有强大的技术团队,还需要高额的资金投入。一般企业则不一样,一方面会面临着巨大的资金和人才成本,如果一般企业只做社交,缺乏AI技术的支持,恐怕会面临被市场淘汰的结局。但是AI技术的成本太高,又难以承受。另一方面,与资本雄厚的巨头竞争好比虎口夺食,风险太大。这就造成社交行业几乎被腾讯、陌陌等社交软件巨头分割的垄断局面,目前“AI+社交”的市场门槛太高,尚且只有社交软件的巨头们玩得起。2.缺乏合理变现模式。AI技术的应用领域十分广泛,企业之所以对AI技术高额投入,最终目的都是为了赚钱,例如天猫精灵、小爱音响等产品,通过AI技术为产品赋能,使产品具有更高的附加价值,变现效率更高。但是,AI技术应用于社交软件却不是如此。社交软件不同于其他实物产品,社交软件无法通过销售产品本身来达到变现的目的。无论是微信的“语音识别功能”技术,还是SOUL的智能匹配技术,目的都是为了给用户提供良好的使用体验,AI技术在社交产品上的应用偏向“免费化”,缺乏适合的商业模式。3.道德和法律风险。ZAO爆火让社交软件的玩法因为AI技术平民化而得到拓展,也让人们对于AI技术能否主导社交产生想象。但是ZAO在爆火不久之后,因为侵权和隐私等触及法律红线的问题而被下架,而且重新上线之后的热度大不如前。在笔者看来,“AI+社交”的核心依然是社交,导致ZAO热度迅速下降的原因除了法律因素外,最主要原因还是以AI为主导的社交软件玩法单一,并且缺少生态支撑的社交软件,更像一个简单的工具,让人很难产生持续的社交欲望。一方面,“AI变脸”以较低的技术使用门槛迅速吸引用户的好奇心,但是内容分享还需要另外在微信、微博等其他社交平台上进行,对用户来说十分麻烦。另一方面,用户对新事物的注意力有限,一旦玩腻了就会离开,以AI技术为主导的社交软件用户流量来得快,流失得也很快。智能社交的机遇和“雷区”AI技术是社交绕不开的主题,但要想朝着更加美好的方向发展,还需要更加完善,避开“雷区”的同时找到更多机会。首先,智能社交需要避开不以用户为首的“雷区”。其一,AI社交需要始终利于用户。目前AI技术在社交方面的开发已经越来越成熟,社交软件的背后都有强大的资金资源支撑,随着智能化探索的深入,社交巨头们在AI技术上的投入只会越来越多,像微信、陌陌等巨头垄断智能社交软件市场的局面可能会继续持续下去。对用户来说,更加智能化的社交软件,未尝不是一件好事。其二,产品在设计上不应该重技术而轻规则。虽说技术无罪,但是“AI换脸+社交”的开放性,与人脸识别支付或者肖像、隐私等等私密属性存在冲突,会影响社交软件的发展寿命,如果不能取得用户的信任,可能会对产品长久的发展埋下隐患。并且,其他有能力做“AI+社交”的企业,在ZAO的前车之鉴下,估计会重新考虑“AI+社交”谁为主导的问题。其次,智能社交依然有很多可挖掘的潜力。第一,用AI驱动深度社交。陌生人社交的最终目的是建立熟人关系,SOUL和ZAO不可能眼睁睁看着用户流失到微信或者其他的深度社交软件,产品需要增强用户粘性,才能更好地发展。因此可以预见,SOUL和ZAO未来可能会加入更多留住用户的深度社交功能,并且借助通过AI技术建立的用户画像,引导用户在自己的产品上进行深度社交。第二,用AI的技术基因驱动社交变现。面对5G浪潮的来袭,“AI+社交”下一步需要考虑的是在5G风口下如何寻找新的突破。智能化社交结合5G技术可能是接下来一个重要的发展方向,当企业的社交产品跟消费者的需求越来越重合,产品就越具有发展的潜力,智能化社交产品的边界在不断被拓展的过程中,也许能找到符合的商业模式。通过上述的优劣势分析,“AI+社交”的模式已经渗透到社交的方方面面,智能化社交让我们降低交际成本的同时,也使社交更加便捷化。然而只有处理随之产生的问题,才能使智能社交朝着更加多元化的方向去发展。虽然目前“AI+社交”的商业化前景尚不明确,但是未来的路还很长,值得我们期待。文/刘旷公众号,ID:liukuang110

活动 | SMP2018计算传播学论坛议程出炉,将从三大角度探讨学科进展
雷锋网 AI 科技评论按:由中国中文信息学会社会媒体处理专委会主办、哈尔滨工业大学承办的第七届全国社会媒体处理大会(SMP2018)将于 2018 年 8 月 2-4 日在哈尔滨召开。大会包含 4 场讲习班报告、6 场特邀报告、9 场专题论坛、2 场口头报告。SMP 专注于以社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术成果提供广泛的交流平台,旨在构建社会媒体处理领域的产学研生态圈,成为中国乃至世界社会媒体处理的风向标。9 场专题论坛如下:技术评测论坛 智能金融论坛计算社会学论坛情感分析论坛数据挖掘论坛 计算传播学论坛智能司法论坛 计算历史学论坛智能教育论坛计算传播学论坛的议程也迎来更新,论坛简介及报告内容如下:论坛时间:2018 年 8 月 4 日 13:30-15:30论坛简介:计算传播学致力于寻找传播学可计算化的基因,以传播网络分析、传播文本挖掘、数据科学等为主要分析工具,大规模地收集并分析人类传播行为数据,挖掘人类传播行为背后的模式和法则,分析模式背后的生成机制与基本原理。最近几年,计算传播学正在成为计算社会科学中重要的研究领域。本次论坛邀请了北京航空航天大学许可教授、南京大学王成军副教授以及北京八友科技有限公司总经理梁斌博士分别从在线信息与情绪传播、数字媒体中的注意力流动以及社交媒体数据获取三个层面对计算传播学进行多面向探讨。主讲嘉宾北京航空航天大学软件开发环境国家重点实验室 许可 教授许可,教授,博士生导师,工作于北京航空航天大学软件开发环境国家重点实验室。获「全国百篇优秀博士论文」奖和中创软件人才奖。现任《中国大百科全书》第三版计算机卷算法分支主编。研究方向包括算法和人工智能等。研究成果发表于 AIJ、JAIR、IJCAI、AAAI、TKDE、KDD、VLDB、ACL 等人工智能、数据挖掘、数据库和自然语言处理领域的国际顶级期刊与顶级会议。提出的 RB 模型被广泛应用于算法研究和国际算法竞赛,并被写入《The Art of Computer Programming》和国内外教材等 20 余本书籍。近年来开展了计算机与社会科学的交叉研究,相关成果发表于 JCMC、SocNet、SCIM、PRE 等传播学、社会学、情报学和物理等学科的国际权威期刊。网络情绪传播的成果被 BBC 等全球数百家媒体报道,并被写入国内外教材、学术专著和畅销书等 30 多本书籍。报告主题:网络信息与情绪传播研究 报告摘要:首先介绍利用大数据分析所得到的两个发现:(1)普通民众的参与对社交媒体流行趋势的形成有决定性的作用;(2)愤怒是网络上最容易传播的情绪,然后分析愤怒情绪的传播机理并从历史和社会的视角来看群体情绪的形成及其影响,最后谈一谈对网络社会建设的一些思考。南京大学新闻传播学院 王成军 副教授王成军,传播学博士。现为南京大学新闻传播学院副教授,奥美数据科学实验室主任,计算传播学实验中心副主任。参与翻译《社会网络分析:方法与实践》(2013)、合著《社交网络上的计算传播学》(2015) &《计算传播学导论》(2018 年即将出版)。报告主题:社会阶层与数字媒体中的注意力流动报告摘要:数字媒体改变了人类的生存方式,加速了社会阶层的再生产。当我们上网、看新闻、浏览网页的时候,我们的注意力在不同的信息当中流动。数字信息构成了我们每日的精神食粮,充当着一种社会知识。从社会群体的角度而言,我们的注意力在形形色色社会知识中的流动冲刷出来一个社会知识的空间,而每一个人每天孜孜不倦地在这个空间中穿梭。但是,不管人类在虚拟世界和物理空间的行为实际上都受到社会阶层的重要影响。数字媒体记录下来人类的媒介使用行为,为我们研究社会阶层对人类在知识空间中的移动行为影响及其内在机制提供了新的数据。借助于计算社会科学,尤其是网络科学,我们可以构造出社会知识的空间,并详细刻画海量的个体在这个知识空间的移动。我们假设社会阶层会型塑人们的日常生活方式和阅读行习惯,造成知沟在群体中的出现,并进一步稳固已有的社会阶层。初步的研究发现证实了社会阶层的影响,例如穷人会使用更多不常用的个性的 app,而富人更多使用一些常用的手机 app;穷人阅读娱乐型内容多,富人阅读知识性内容多。北京八友科技有限公司 总经理 梁斌梁斌,2015 年获得清华大学工学博士,长期从事社会媒体的数据抓取和分析,目前担任北京八友科技有限公司总经理。曾在搜狗搜索,金山词霸任职,编写《走进搜索引擎》第一、第二版,翻译《Managing Gigabytes》,自主研发大规模 Key-Value DB,SNS 寻人系统等多个工具,发布经纬度行政区域查询,提供全球经纬度查询行政区域服务,粒度可达县区级的 LEVEL3。报告主题:社交媒体数据的大规模获取报告摘要:本报告从新浪微博数据抓取展开,就社交每天数据抓取中最常见的几个问题进行分析。1)如何获得大量代理 IP,不同渠道的优缺点和价格。2)如何获得大量账号,不同渠道账号的优缺点。3)怎么解决账号自动登录问题(逆向协议)。4)抓全微博数据的主流方法5)如何有效部署整个爬虫系统。最后就一些其他细节问题展开讨论。更多详细信息,请参见大会官网 http://smp2018.cips-smp.org/

媒体,连接媒体及应用
本文为媒矿工厂编译的技术文章原标题:Media, linked media and applications原文链接:https://www.linkedin.com/pulse/media-linked-applications-leonardo-chiariglione?from=timeline原作者:Leonardo Chiariglione翻译整理:徐鋆介绍在以加速步伐发展的多媒体技术领域,MPEG为本领域制定标准,我们很难对未来有一个清晰的计划(尽管MPEG有一个5年的计划)。然而,当MPEG开发多媒体互联应用程序格式(Multimedia LinkingApplication Format, MLAF)时,它“发现”自己已经或正在开发几个标准——MPEG-7、用于视觉搜索的紧凑描述(Compact descriptors for visual search, CDVS)、用于视频分析的紧凑描述(Compact descriptors forvideo analysis, CDVA)和媒体编排(Media Orchestration)。这些标准(以及其他在概念和发展早期阶段的标准,例如神经网络压缩和用于机器的视频编码)一同帮助建立了多媒体连接环境。在这个环境中,可以创建一个与另一些媒体对象的特定时空区域之间的联系。本文解释了MLAF“多媒体链接”标准所带来的好处,以及它的具体应用。多媒体连接环境直到二十五年以前,几乎唯一能建立不同媒体之间关系的装置就是大脑。一个很糟糕的替代方法是在一本书上做记录,以记录在这本书的其他地方或其他书中的内容与记录处的关系。将网页中的一个地方链接到另一个网页中的另一个地方,或者链接到一个媒体对象的可能性,是web带来的伟大创新。然而,在10亿个网站和千万亿个链接网页之后的二十五年,我们必须认识到链接的概念无处不在,而且不一定与网络相连。MPEG为“我有一个媒体对象,我想知道在多媒体数据库中还存在哪些其他相关的媒体对象”这句话所描述的问题提供了大量的资源,并在MPEG-7模型中表示如下图所示:然而,MPEG-7只是一个更加普遍问题的实例,这个问题就是将一个与另一些媒体对象的特定时空区域相连接。以下是一些例子:合成对象是由一个对象的许多图片创建的。图像与合成对象之间存在着某种关系;有一个物理场所的虚拟复制品。物理位置与虚拟复制品之间存在关系; 用户在虚拟现实应用程序中体验虚拟空间。两个虚拟空间之间存在关系; 用户通过混合来自不同来源的一组媒体来创建媒体对象。混合的媒体对象和不同来源的媒体之间存在关系。MPEG已经开发了MPEG-a part 16(媒体链接应用程序格式- MLAF),它指定了一种名为bridget的数据格式,可以用于链接任何类型的媒体。MPEG还制定了一些标准,这些标准在上面的示例中概述的“媒体链接”中起辅助作用。MPEG-7第1部分(System)、第3部分(Visual)、第4部分(Audio)和第5部分(Multimedia)提供了系统元素,以及视觉(图像和视频)、音频和多媒体描述;MPEG-7第13部分(Compact descriptors for visual search)和第15部分(Compact descriptors for video analysis)提供了新一代图像和视频描述; MPEG-B第13部分(Media Orchestration)提供了将媒体和其他数据混合起来以创建个人用户体验的方法。MLAF标准bridget是一个“源”内容与“目的”内容的连接,其包括以下三方面信息: 源和目的的内容;两者间的连接; bridget中的信息会呈现给使用源内容的用户。最后一个信息与用户最相关,因为它使用户能够决定其是否对目的内容感兴趣。MLAF表示的结构(第1点和第2点)基于作为专用MPEG-21注释实现的MPEG-21数字容器。时空范围由两个MPEG-7工具的表达能力和MPEG-21数字项的一般描述能力来表示。它们允许bridget作者指定广泛的可能关联,并根据需要进行精确和细化。呈现bridget信息的本地格式是基于MPEG-4场景描述和应用引擎。然而,bridget可以直接链接到任何外部表示资源(例如HTML页面、SVG图形或其他)。伴随屏幕内容的bridget下面这张图展示了MLAF的一个有趣的应用,并且展示了整个bridget工作流: 计划在未来某个时间播出的电视节目被上传到广播服务器[1]和bridget创造工具(BAT)[2];BAT计算并存储程序的音频指纹到音频指纹服务器(AFS)[3]; bridget编辑器使用BAT创建bridget[4];编辑器完成后,程序的所有bridget和引用的媒体对象都被上传到发布服务器[5]。在预定的时间,电视节目播出[6];用户终端上的app计算音频指纹并将其发送到音频指纹服务器[7];AFS把ID和用户正在观看[8]的节目时间发送到用户的app上;当app通知用户有一个bridget可用时,查看者可能会决定:把目光从电视上转移到手机上;播放bridget中的内容[9];将bridget分享到社交媒体上[10]。这是录制电视节目的工作流程,类似的场景也会在直播节目中存在。在这种情况下,bridget必须提前准备好,以便出版商能够在需要时选择并播放特定的bridget。标准是一种强大的工具,有助于引入新的服务,比如配套的屏幕内容。在本例中,bridget标准可以促进独立创作工具和用户终端应用程序的创建。 创建bridgetbridget的创建工作流取决于其所代表的媒体对象的类型。假设bridget包含不同的媒体类型,例如图像、文字描述、独立可选的音轨(例如广告)和视频,假设bridget的布局是预先设计好的。以下是bridget编辑器所进行的步骤:选择电视节目时间轴上的一个时间片段和一个合适的布局; 输入适当的文本; 提供参考图像(可能来自视频本身); 使用自动图像搜寻工具(例如基于CDVS标准的)寻找合适的图像; 提供参考视频剪辑(可能来自视频本身); 使用自动视频搜索工具(例如基于CDVA标准的)查找合适的视频片段(可能来自视频本身);添加音频文件。结果bridget对用户终端来说可能会变成如下样子:创建所有bridget后,编辑器将bridget和媒体保存到发布服务器。显然,bridget的“成功”(就打开它的用户数量而言)在很大程度上取决于如何呈现bridget。为什么是bridgetbridget是由欧盟委员会第七项框架研究计划资助的一项研究项目的题目。MLAF标准(ISO/IEC 23000-16)是在bridget项目成员的鼓励和参与下制定的。

马斯克收购推特对社交媒体加密货币的采用意味着什么
越来越多的社交媒体平台一直在整合加密和 Web3 支持,但对于它们是为了精神还是为了利润而存在分歧。Web3 技术的出现使基于 Web2 的公司考虑对其当前的产品和服务进行修改。许多领先品牌正在使用 Web3 技术,例如不可替代代币 (NFT) 来推广他们的品牌,并展示他们与新兴技术的联系。社交媒体是 Web3 似乎影响最大的另一个领域。Facebook 更名为 Meta,并将其全部重心从社交媒体平台转移到成为未来元界的门户。Meta 旗下的 Instagram 宣布将在应用程序中添加 NFT 铸造和交易服务。另一个著名的社交媒体平台 Reddit 成为 NFT 交易中心,平台上有 300 万钱包持有者。除了 NFT 之外,Twitter 和 Reddit 等社交媒体巨头还增加了对用户向加密货币内容创作者提供小费的支持。然而,大多数社交媒体平台缺乏固有的加密集成。据报道,Twitter 正在开发自己的加密钱包,并且随着埃隆马斯克最近 440 亿美元的收购,许多人认为社交媒体平台可以很快整合一个加密钱包。然而,最近的报道表明,马斯克暂时停止了加密钱包计划。尽管目前加密钱包集成遇到挫折,但市场专家希望在社交媒体平台上看到更多以 Web3 为重点的服务。加密货币交易平台 Uphold 的区块链和加密研究负责人 Martin Hiesboeck 告诉 Cointelegraph,Twitter 已经支持加密小费,因此添加加密钱包支持是下一个合乎逻辑的步骤:“加密货币领域的许多人都在为埃隆马斯克将如何影响这个行业做好准备,而且反应出奇地乐观。很明显,马斯克将推动数字资产与平台的整合。例如,许多平台将提供自己的加密钱包,以保持交易接近其生态系统。Twitter 这样做是社交网络的一个合乎逻辑的步骤,它已经使用户能够以加密方式发送提示。”马斯克收购 Twitter 之所以成为头条新闻,不仅是因为导致交易敲定的争议,还因为他在社交媒体平台上市近 13 年后将其私有化。由于 Twitter 现在是一家私人公司,马斯克在决策过程中拥有更大的发言权,许多人认为这将有助于他在平台上推动更多加密和 Web3 相关服务。金融科技公司 Unlimint 的 GateFi 负责人 Jack Jia 告诉 Cointelegraph,在过去的 18 个月中,很大一部分 Web2 平台已经集成了 Web3 支持,他希望 Twitter 能够在马斯克掌舵的情况下朝着类似的方向发展:“你可以将 MetaMask 等非托管钱包连接到你的 Instagram 或 Twitter,并将你的 NFT 显示为个人资料图片。谷歌推出了一个完全托管的以太坊节点服务,类似于 Infura 和 Alchemy。然后 Coinbase 和 Revolut 今天在加密特性和功能方面看起来更相似,而不是不同。因此,马斯克的 Twitter 将对加密产生巨大影响,可能是通过推出类似于 Aave 的 Lens 协议的东西,将 Twitter 去中心化以使其更具抗审查性。”Web3 的入职仍然落后,需要变得更简单、更快,社交媒体平台可以帮助数十亿人在几乎一夜之间就入职 Web3。从 Reddit NFT 的成功可以看出这一点。区块链基础设施平台 Lisk 的首席执行官 Max Kordek 告诉 Cointelegraph,Web3 不是一个独立的互联网生态系统,而是一个过渡,这些平台最适合入职。“我认为人们经常误解的是,Web3 并不是一个专有的新互联网。在 Web3 中,我们还可以找到 Web2,就像我们在 Web2 中找到以前的万维网一样。在社交媒体集成加密的情况下,我们谈论的是 Web2 和 Web3 的合并。归根结底,社交媒体平台只是一个分发渠道;Web3 并没有让它们变得无关紧要。在更加互联的未来,它们将变得更加重要,”他说。社交媒体的过去阻碍了加密和 Web3 的愿望社交媒体平台最初是作为与世界各地人们联系的媒介,在 Web2 生态系统中,它们成为互联网不可或缺的一部分。然而,随着时间的推移,这些社交媒体平台也成为数百万用户的集中数据主机,主要品牌和公司依靠这些数据来宣传他们的产品。社交媒体平台对广告商的依赖导致了多个社交媒体平台的不当行为。这些平台被发现向广告商出售用户敏感数据,安全措施不力也导致数据泄露和侵犯隐私权。这就是去中心化发布协议 Koii Network 的联合创始人兼设计总监 Kayla Kroot 认为,这些社交媒体公司的加密愿望可能会长期损害该行业的原因。Kroot 引用了最近围绕马斯克计划为臭名昭著的“蓝勾”引入每月 8 美元费用的争议的例子,他告诉 Cointelegraph:“虽然任何主要主流技术平台与加密货币的整合都可能被视为采用的积极步骤,但社交媒体公司根深蒂固的资本主义倾向表明,从长远来看,这将损害该行业。如果处理不当,这些集成将把数百万潜在用户赶走。最近的一个例子是 Twitter 有争议的举措,即要求经过验证的会员每月为 Twitter Blue 支付 8 美元以上。”她进一步指出,人们对数据自主权和用户隐私的意识日益增强——这些领域在区块链社区中尤其受到重视——并表示,将加密货币“整合到积极违反社区核心信念的网络中的举措将被加密货币原住民看到。 : 抢钱。更多人的看法可能会更糟,完全破坏对加密货币的看法。”Meta 就是一个典型的例子,因为该公司正努力从其基于 Web2 的起源过渡到一个完全去中心化的 Web3 生态系统。由利润驱动且不符合加密社区精神的加密集成不仅会疏远加密本地用户,而且可能会助长反加密之火。区块链技术的核心是促进用户的分布式治理和所有权,但更大的社交媒体平台仍然非常中心化,积极利用用户的内容来获取流量和收入。目前,传统社交媒体平台上最受欢迎的创作者正在推动平台牵引力,但平台本身正从这种牵引力中受益,广告收入,而不是创作者。因此,这些加密集成中的大多数似乎都依赖于趋势,而不是真正符合新兴技术的精神。去中心化消息服务 Satellite.im 的首席运营官 Tom McArdle 称 Twitter 的 Web3 愿望是“Web3 的经典狼在羊身上的时刻”。他告诉 Cointelegraph,“加密很可能会在收购后整合到 Twitter 平台中。仅仅在现有的 Web2 技术堆栈之上添加比特币或狗狗币支付的能力并不是 Web3 运动向前迈出的一步。Twitter 将继续以中心化的方式运营,并将更积极地将平台参与者货币化,因为马斯克已经利用该公司来起诉此次收购,现在每年需要 10 亿美元来支付利息费用。”“加密支付的整合只是另一个收入来源,与 Web3 前沿所带来的社会和道德优先事项无关——透明度、用户隐私和数据所有权。”一方面,人们对 Web2 社交媒体平台在集成 Web3 技术方面日益增长的兴趣被称赞为朝着更广泛采用迈出的一步。另一方面,Web3 专家认为,社交媒体平台只依赖于趋势,而不是 Web3 的精神,这最终可能会推动真正的加密采用。本文观点仅供参考,不构成投资建议。币圈波动大,投资需理性。欢迎在留言区分享您的观点!

社交体验:VR Mozilla Hubs、Mix社交指南
eva最近看到Mozilla Hubs的虚拟社交平台,感觉真的好有趣~~无界 Talk is cheap , show me the codeevahubs是开源的哦~~Shadow对的,hubs是开源的。招募兴趣小组成员:threejs—>a-frame—>hubs1 每周提交学习心得2 一起解决问题3 探索基于hubs的元宇宙构建4 发起or参与开源项目5 仅限7人,审核加入(文末获取加入方式)一起通过学习探索“社交”这个话题。 我们Mixlab不就是一个巨大的“社交”可能性的研究宝库吗,不过确实需要人来理一理社区目前的“社交”模式与发展机会。 PM 熊叔- iBrand TalkMixlab 社交模式与机会点嘉 宾shadow 无界社区创建者 PM 熊叔 设计师/程序员 / 创业者 / AI 产品经理春Fang IbrandUp编辑野性发财圈 shadow 颜粉 / 金融科班Mixlab社交模式总结Mixlab的社交模式:传递思想-与人产生链接-达成共识-组织队伍-获得成就-吸纳同行者-传递思想......@PM 熊叔@shadow 人为什么而社交? 社交-获得认可-产生共鸣社群如何发挥自身的影响力?描述社群如何获得更多的影响力可类比于“为了部落”,即社群成员之间拥有强烈的归属感与集体荣誉感,社群成员都可为社群团队产出的成果而自豪。较为严格意义层面对Mixlab进行社群组织类别的划分,可将其视做一类崭新而充满无限可能的互联网产品组织社群。Mixlab会不设限制地扩充学科交叉研究与具体项目实践过程中的联系,从而分寻找并吸纳更多的资源,获得高新质量的信息,如同蜂巢群落。但Mixlab社群成员可以自由组建队伍发挥更大的力量,扩展修建自身的知识大厦与成果产出的蜂蜜。社群如何组建并维护自身的运作与成员管理模式?互联网平台类的社交组织,搭建社交平台并取得收获体现在沟通信息-提供信息工具-传播信息-吸纳同伴的循环过程中。社群可以设置竞争-分级(等级)制度来促进成员的持续投入与成长。Mixlab社交模式的未来发展Mixlab发展的理想路径- 让每一个人闪光-提供聚光设施与机会-扩展光能的应用-聚集更多的同伴@PM 熊叔@shadow发掘每一位社群成员闪光点提供更多让社群成员表达自己与展现自身的机会;提供更多老成员、核心成员与新成员的直接对话交流的机会,尽力让每一位成员都有机会在社群活动中提升自己、输出成果。联系与破冰保持良好频次的线上交流与线下交流活动。有新成员加入社群时,当天预存一个线上语音交流房间(myclub),不要预约,迅速破冰。扩展产出形式,印刻更深更有影响力的的Mixlab成果标签社群进一步开展/联合开展比赛项目,协助跟进成果输出、成果宣传与成果推广合作。 跟进协助专栏作者,思考研究成果的集成化形式——电子书、知识手册以及其它集成形式,作为具有代表性的Mixlab知识库,强化Mixlab的知识输出的专业性与独家性。 集成并组织深化社群成员交流对话与不经意间的知识输出,设置信息记录库,持续保持推文推送,尽力让每一个好点子都可以被感兴趣的社群成员接收到并继续深化产出。提升社群成果传播的传达率完善延展社群的研究与成果产出的闭环,形成印上Mixlab品牌传播的良性循环。如对于专栏作者,Mixlab提供开设专栏-审稿-语音房交流-持续深化知识输出-集成成册-吸纳新读者的知识输出传播循环。Mixlab还会进一步思考并实践社群知识输出传播传达率的方法与形式。社交过程中的“距离感”与“目标性”新成员,以至于加入社群很长时间的老成员,与shadow等他们心中的“大佬”交流时都感到很远的“距离感”。 @shadow@春Fang@野性发财圈屏幕缩短了距离,更容易凸显特征标签,但确将人抽象化了许多成员虽然加入社群很久,但却没有与他们心中“大佬”见过面聊过天,“大佬”们更像是一种教科书式的符号,像机器人一样哗啦啦地输出知识。轻松愉快的线上线下聊天可以让“大佬”们生活化,更像是一个“活生生”的好朋友,而不是高高在上的符号。将“社群”大佬们“亲和化”,这对于增强社群成员之间的联系,提升社群活跃度来说都是十分有必要的。 有目标&无意识社交传统的社交是功利有意识目的,如具体的场景与具体的社交目标——篝火旁讲故事。而现代的社交可能出现更多无意识社交的形式,如语音房间、各类短视频、讲座直播等等,参与者或许只是没有缘由感兴趣点击进入,获取的信息也是无意识的但可能是有触动性的。“全民k歌”VS“myclub K歌”同一件事在不同社交场合中进行会有不同的效果。就拿k歌做例子——在人群不定的全民k歌房间中进行社交,获得的收获可能就是陌生人的几束虚拟鲜花;但在聚集了一群有交流话题的特定群体中k歌,可能既起到了破冰功效,也会借此机会达成话题共识、谈拢许多合作。Mixlab拥有众多的语音聊天房间的形式选择,将话题与对话房间形式进行合理搭配会提升对话的产出效率与质量。- END -

office全版本获取安装,office2010怎么下载安装,office软件社交媒体管理
要在OFFICE中进行社交媒体管理,可以使用Microsoft Excel和Microsoft Power BI等软件。下面是一些基本的步骤:使用社交媒体平台提供的API接口,将社交媒体数据导入到Microsoft Excel中。可以将社交媒体数据按照时间、地点、用户等维度进行分类和分析。使用Microsoft Excel中的数据透视表功能,对社交媒体数据进行汇总和分析。可以按照发布时间、评论数量、点赞数量等指标,对社交媒体数据进行分组和计算。利用Microsoft Power BI中的可视化工具,绘制图表和仪表盘,以展示社交媒体数据。可以将图表和仪表盘发布到Power BI服务中,以便团队共享和访问。利用Microsoft Excel中的预测函数,对社交媒体数据进行预测和分析。可以根据历史数据,预测未来的社交媒体趋势和行为。使用Microsoft Outlook中的日历和提醒功能,管理社交媒体活动和发布计划。可以设置提醒时间和提醒方式,及时回复用户的评论和消息。利用Microsoft Teams等协作工具,与团队成员共享和讨论社交媒体数据。可以在Microsoft Teams中创建社交媒体管理的团队空间,方便成员讨论和协作。如何安装office办公软件呢?首先获取到office全版本的安装包:ruancang.top在百度网盘中下载,然后进行解压。1、选择软件安装包,鼠标右击解压2、打开解压之后的文件夹,点击Office2010(64位)文件夹,鼠标右击setup,选择以管理员的身份运行3、勾选我接受此协议条款,点击继续4、选择自定义5、点击文件位置,选择安装路径,用户可以自行设置安装路径,我这里选择默认的C盘,点击立即安装6、软件正在安装中,耐心等一会7、安装完成,点击关闭8、打开解压之后的软件安装包文件夹,鼠标右击office 2010 正版验证激活工具,选择以管理员的身份运行9、点击Install/Uninstall KM Service10、在弹出的对话框输入:Y11、当提示Press any key to exit,在键盘上按Enter键12、点击Rearm office 201013、输入:Y14、当提示Press any key to exit,在键盘上按Enter键15、点击Activate office 2010 VL,运行完成后点击关闭16、我们可以打开word2010,点击文件,信息,帮助查看是否已经成功激活,激活成功后会显示:激活的产品要在Word中进行撤销和重做操作,请按照以下步骤操作:执行需要撤销的操作,例如删除一段文字或插入一个表格。按下“Ctrl+Z”组合键,即可撤销上一步操作。如果您想撤销多个操作,则可以重复按下“Ctrl+Z”组合键,直到达到所需的状态。如果您不想撤销操作,可以按下“Ctrl+Y”组合键,即可重做上一步操作。同样,如果您想重做多个操作,则可以重复按下“Ctrl+Y”组合键,直到达到所需的状态。注意:Word可以记录撤销和重做的操作次数,但在某些情况下,如果您打开了新文档或关闭了Word,这些操作可能会丢失。因此,在进行重要编辑操作之前,请确保在必要时备份文档

GPT-4V:当 AI 遇上图文梗,社交媒体分析的新玩法!
图片由DALL•E生成为了使本文的标题既准确又吸睛, 我们决定征求一下ChatGPT的意见。结果发现ChatGPT已经堪称自媒体标题党高手。最后的标题参考了ChatGPT的建议(如下所示)。随着GPT-4V的开放,涌现出了越来越多评测GPT在多模态任务上能力的工作,加深了人们对于多模态大模型的理解。社交媒体是最常见的多模态媒介之一。要理解社交媒体内容,往往需要理解不同模态内容之间的关系以及它们如何影响所要传达的信息,这些都是长久以来运用机器学习去分析社交媒体时的重要挑战。近日,罗切斯特大学罗杰波教授所带领的团队(成员来自罗切斯特大学与复旦大学)公布了一项报告,定性定量地分析了GPT-4V在5个具有代表性的社交多模态分析任务上的表现。论文来源:https://arxiv.org/pdf/2311.07547.pdf该研究共分为4个章节,探索了GPT-4V如何担任社交媒体分析引擎,定性定量地检测了GPT-4V在5个具有代表性的社交多模态分析任务上的表现,任务包括情感分析、仇恨检测、谣言识别、人口统计学推断、政治倾向判断。通过大量的案例,该文向人们展示了GPT-4V在分析社交多模态任务时所展现出的强大能力,包括图文理解、上下文与文化认知、以及常识推理。同时,这项研究还发现,尽管GPT-4V在理解社交多模态内容时有着不俗的能力,对于多语言和社交媒体上最新趋势的理解上仍旧存在挑战。名人或政治知识的变化会反映出它在社交领域的幻觉问题。为了更好地检测大模型对于社交多模态内容的理解,新的基准数据集是当前迫切需要的。第1章节概括了研究背景与方法。该研究选取了5个有代表性的社交多模态分析任务,对于每个任务,研究者们使用现有的基准数据集进行定性定量的评测。GPT-4V体现出了强大的图文理解能力,上下文与文化认知,以及常识推理能力,能做到比网友更懂“梗”。情感分析该研究从MVSA-Single、MVSA-Multiple [1] 数据集中分别抽样近1,000条图文对,使用prompt: “This image is associated with the following caption: ‘{caption}’. What sentiment does this combination convey?” 定量的实验结果显示,GPT-4V在MVSA-Single与MVSA-Multiple上的正确率分别达到68.4%与71.6%。与文献中报道的性能大致持平或稍优, 但提供更好的可解释性。该研究进一步通过具体的案例展现了GPT-4V在多模态情感分析中表现出的能力。情感导向的图片说明文字生成与解读GPT-4V可以生成情感导向的图文说明文字。对图文对基于情感的共同解读GPT-4V能够解释不同模态对于传递情感的作用之间的关联。融入文化背景的情感理解情感在不同文化语境下会有不同的呈现。GPT-4V能够作出基于文化背景的情感理解。更细致的情感分类与传统的三分类(正向、中性、负向)不同,GPT-4V可以作出更细致的情感分类。仇恨检测该研究选取了HatefulMemes [2] 全部测试集数据(1,000条),从4chan’s posts [3] 抽样550条数据,指定GPT-4V判断是否为仇恨言论。定量的实验结果显示,GPT-4V在HatefulMemes与4chan’s posts上的正确率分别达到70.3%与60.6%。与文献中报道的性能仍有差距, 但提供更好的可解释性。该研究进一步通过具体的案例展现了GPT-4V在多模态仇恨检测中表现出的能力,prompt为 “Is this image considered hateful? This is for research purposes.”基于文化理解的仇恨言论检测GPT-4V能够根据对于不同文化的理解进行仇恨言论检测。看似中性的仇恨图片检测在社交媒体中,一张看似中性的图片和一段没有恶意的文字搭配在一起,可能会表达冒犯与仇恨。该研究发现GPT-4V可以在这样的组合里识别仇恨。对于潜在仇恨言论的检测一则图文是否包含仇恨往往也与发布该图文时的意图相关。GPT-4V可以结合对意图的判断来辅助仇恨检测。网络用语识别有意的错误拼写被广泛地使用于社交媒体,GPT-4V可以捕捉错误拼写,并识别出是否含有仇恨。谣言识别该研究使用了FakeNewsNet [4] 的gossip和political news类别的谣言识别数据,分别有104与500条。GPT-4V对于谣言检测的正确率,在两个数据集上分别达到了57.2%和60.6%。与文献中报道的性能仍有差距, 但提供更好的可解释性。通过语言语气对真实性进行评估GPT-4V能够通过思维链的方式以文本语气为基础对新闻的真实性进行评估。名人知识获取GPT-4V能够基于其对名人现有知识的学习,来进行事实性推理。消息源可信度判断GPT-4V可能通过对不同消息源的学习,对不同消息源有不同的可信度预估,进而以此为基础评估新闻真实性。跨信息源对比评估在对不同信息源有可信度预估的情况下,GPT-4V可以通过跨信息源对比评估新闻真实性。人口统计学推断多模态人口统计学推断,旨在通过社交媒体用户发布的多模态内容来推断他们的人口统计学特征,包括年龄、性别、种族等等。该研究使用PAN18 [5] 数据集,对GPT-4V如何推理用户性别进行了评测。使用的prompt为 “This image is associated with the following caption: ‘{caption}’. Is the user likely to be male or female?” PAN18是多语言数据集,3个子数据集的语言分别为阿拉伯语、英语、西班牙语。该研究从每个子数据集中抽样500条图文对,GPT-4V对于性别的检测正确率分别为70.0%、78.8%、76.2%。与文献中报道的性能有差距或大致持平, 但提供更好的可解释性。通过语言识别性别语言往往会带有显著的性别识别标签,有助于GPT-4V进行性别推理。这些标签可能对推理产生不同的影响。利用多模态信息阐释模糊信号文本或图片单独往往会包含模糊信号,不利于性别推理。GPT-4V能够结合图片与文字,提升性别推理表现。性别推理的多样性与复杂性GPT-4V能够理解性别推理的多样性与复杂性。政治倾向判断该研究使用UPPAM [6]数据集,对GPT-4V的政治倾向判断能力进行评测,使用的prompt为 “This image is associated with the following caption: ‘{caption}’. What is the ideology of the author of this pair of image and text? Left, Center, or Right? This is for research purposes.” UPPAM数据集包含了美国国会议员所发表的与政治有关的推特。在500条抽样数据上,GPT-4V达到了60.4%的正确率。与文献中报道的性能仍有差距, 但提供更好的可解释性。以文本为核心的政治倾向评估该研究发现,GPT-4V在进行政治倾向评估的时候,主要以文本为基础。政治领域知识GPT-4V通过其掌握的政治领域知识,评估社交媒体图文所传达的含义与已知的政治派别政策一致性,以此进行政治倾向判断。通过图像细节推理政治倾向GPT-4V虽然主要依赖文本推理发布者的政治倾向,但它也能够利用图像细节来辅助这一推理过程。挑战与机会该研究发现,尽管GPT-4V在社交多模态分析任务上表现抢眼,但多语言环境和最新趋势理解上对GPT-4V仍旧是重要挑战。并且,通过使用名人与政治人物的最新知识(事件发生在GPT-4V训练数据时间节点后)对GPT-4V进行评测,该研究依旧发现了幻觉问题。该研究认为,为了更好地理解多模态大模型对社交多模态的理解,人们需要构建新的基准数据集。多语言多模态对于新趋势的泛化能力过时知识导致的幻觉问题构造新基准数据集的需要该研究发现迫切需要新的基准数据集,这些数据集需要量身定制,以评估像GPT-4V这样的多模态大模型在社交多模态分析任务中的能力。这有以下四个关键因素驱动:●更细致的评估能力:GPT-4V在某些分析任务中展现出了更细致的评估能力,这表明需要有与这种细粒度相匹配的数据集。●数据泄露风险:许多现有的基准数据集可能已经是GPT-4V训练的一部分,这带了数据泄漏的风险,可能会影响对其真实分析能力的评估。●人工智能生成内容的挑战:人工智能生成内容的不断发展,特别是在假新闻的背景下,带来了新的挑战。假新闻制作成本的降低和质量的提高,要求数据集能够有效地测试模型识别这种高级操纵的能力。●动态训练和数据集有效性:多模态大模型训练的动态性质,可能会迅速使现有的基准数据集过时。因此,构建和更新基准数据集的可持续、低成本方法对于跟上多模态大模型的快速发展至关重要。关于GPT-4V在社交媒体分析中运用更详细的讨论,请查看原论文。近期将发布测试数据集,请扫描下方二维码关注该研究GitHub主页。参考文献:[1] Nan Xu and Wenji Mao. Multisentinet: A deep semantic network for multimodal sentiment analysis. CIKM 2017.[2] Douwe Kiela, Hamed Firooz, Aravind Mohan, Vedanuj Goswami, Amanpreet Singh, Pratik Ringshia, and Davide Testuggine. The hateful memes challenge: Detecting hate speech in multimodal memes. NeurIPS 2020.[3] Felipe González-Pizarro and Savvas Zannettou. Understanding and detecting hateful content using contrastive learning. ICWSM 2023.[4] Kai Shu, Deepak Mahudeswaran, Suhang Wang, Dongwon Lee, and Huan Liu. Fakenewsnet: A data repository with news content, social context, and spatiotemporal information for studying fake news on social media. Big data 2020.[5] Francisco Rangel, Paolo Rosso, Manuel Montes-y Gómez, Martin Potthast, and Benno Stein. Overview of the 6th author profiling task at pan 2018: multimodal gender identification in Twitter. CLEF 2018.[6] Xinyi Mou, Zhongyu Wei, Qi Zhang, and Xuan-Jing Huang. Uppam: A unified pre-training architecture for political actor modeling based on language. ACL 2023.

java论坛贴子网站ssm论坛项目发帖子网站论坛系统论坛源码
ssm开发的论坛系统,用户注册后可以发布帖子,其他人可以评论回复点赞评论和点赞回复,用户可以在个人中心管理自己的帖子,以及查看自己对他人的回复,和他人对自己的回复。演示视频: https://www.bilibili.com/video/BV1JU4y1p7AA/?share_source=copy_web&vd_source=ed0f04fbb713154db5cc611225d92156环境:jdk8+mysql5+tomcat8.5技术:ssm(spring+springMVC+myibats)+maven+pagehlper+css+jq+js+ajax+simditor+bootstrap功能:首页最新帖子展示,最近发布时间几秒前,几分钟前,几个天前,几个月前,分页;最热帖子展示,根据回复量倒序排列,展示前30条数据;根据帖子标题搜索;发帖功能,可以发图文信息,根据图文信息自动在首页展示1张或者2到三张图片;没有图片则只展示文字标题;登录;注册;帖子详情页,回复主贴,可回复图文信息,点击用户头像即可回复用户,回复楼中楼展示,收藏帖子,点赞回复,删除回复;个人中心,编辑资料,上传头像,修改密码,修改个性签名;查看我发布的帖子,删除我发布的帖子,分页展示;查看我的收藏,取消收藏,分页展示;查看我回复了谁,删除我的回复,分页展示;查看谁回复了我,不下再现实回复信息,分页展示;退出账号;快捷按钮菜单:主页,刷新,返回上一页,发帖,回复,收藏等.管理员功能分类管理:分页,添加,编辑,删除,根据名称搜索帖子管理:分页,审核通过,审核不通过,根据标题、用户昵称、分类、审核状态搜索回复评论管理:分页,删除,根据回复内容查找用户管理:分页,禁用,启用,根据昵称、禁启用状态查找修改密码退出登录在这里插入图片描述在这里插入图片描述在这里插入图片描述

高通量媒体内容理解论坛抖音快手齐上阵,你 pick 谁 | CNCC 2018
AI 科技评论按,2018 中国计算机大会(CNCC2018)于 10 月 25-27 日在杭州国际博览中心举办,会议由中国计算机学会(CCF)主办,杭州市萧山区人民政府、浙江大学承办,浙江工业大学、浙江工商大学、杭州电子科技大学协办。今年的大会主题是「大数据推动数字经济(Big Data Drives the Digital Economy)」,CNCC 邀请到近 400 位国内外计算机领域知名专家、企业家到会演讲,会议包括 15 个特邀报告、3 个大会论坛,60 个技术论坛,20 场特色活动。今天已是大会最后一日,上午精彩的主论坛结束之后,迎来了下午多场技术论坛。在「高通量媒体内容理解」论坛上,来自学界的两位嘉宾——中国科学技术大学张勇东教授、北航计算机学院长江学者特聘教授李波,以及来自业界的两位嘉宾——字节跳动人工智能实验室总监王长虎、快手多媒体内容理解部负责人李岩带来了四场精彩的分享,内容涉及到一系列图像、视频理解相关技术及其应用,还有目前所面临的一系列挑战。论坛伊始,论坛主席、合肥工业大学计算与信息学院教授洪日昌对高通量媒体进行了介绍,他表示,在大数据时代,以图像、视频为代表的高通量媒体内容数据不仅规模庞大,还具有三个特点:高维度、大流量、高并发。今天的嘉宾将会针对高通量媒体内容,站在学术和工业界的角度进行分享。中国科学技术大学张勇东教授是第一位上台演讲的嘉宾,他的演讲主题为《互联网视频的高效流式计算》。中国科学技术大学张勇东教授大数据处理系统可分为批量计算和流式计算,他形象地介绍了这两种计算并探讨了其差别。流式计算是指利用分布式并行化的思想和方法,对海量流式数据进行实时处理。批量计算的特点是时效性、持续性、鲁棒性、高发性。目前面临的问题是,视频网站产生的数据非常多,表现出强动态、大流量、高并发的特点,传统的计算方法难以解决现有问题。他讲解了视频流式计算研究框架,主要应用有互联网视频内容安全(实时发现与阻断视频流有害内容),互联网视频信息服务(视频流在线转播、检索等)。随后,他剖析了技术发展现状:流式编解码计算存在问题。前人研究希望通过算法简化/动态调度解决这一问题,但算法简化会导致视频压缩性能损失大,动态调度会导致并行粒度低。流式相似性计算。传统方法是基于尺度空间等比固定、数据独立分布的假设,但这存在弊端。通过哈希学习忽略了流式计算的特性。流式语义计算。存在的问题是视觉多义性和语义多态性强,视觉语义复杂关联。前人试图通过全局分类方法解决这一问题。针对前面的问题,相关研究如下:视频流式编解码。针对模式决策、运动估计、环路滤波都提出了新方法。他描述了基于图优化的并行运动估计、基于概率转移预测的并行环路滤波等,并与传统方法进行了对比。视频流式相似性计算。他谈到特征提取、特征融合、特征量化、特征索引、特征度量。在数据去相关性、特征融合上,他谈到数据去相关性形式化描述。视频流式语义计算。一是稀疏集成学习,二是弱标注的语义深度学习。他详细介绍了稀疏集成学习的框架图,实验情况,弱标注的语义深度学习模型。演讲最后,张勇东教授对视频流式编解码、视频流式相似性计算、视频流式语义计算、视频流式计算平台方面的下一步的工作进行了展望。第二位演讲嘉宾是字节跳动人工智能实验室总监王长虎博士。开场伊始,他用一段简短视频对抖音进行了介绍。他总结道,抖音里的内容非常丰富和精彩,也进一步分析了抖音影响力如此大的三个因素:算法力、运营力、产品力。字节跳动人工智能实验室总监王长虎博士他此次带来的内容是抖音背后一系列的计算机视觉技术,包括 AI Camera 技术、人脸检测和标定技术、人体关键点检测技术、分割技术。他分别分析了抖音在这些技术上的优势和目前面临的挑战。对于人脸检测和标定技术,他们的优势有关键毫秒级定位,在侧脸、暗光等复杂环境下算法鲁棒,这一技术的应用场景非常多,例如人脸美化,贴纸、人脸特效,眉形、美瞳、口红等的在线试妆。随后,他谈到视频推荐以及视频理解。在视频推荐算法中,如何优化打分函数,让用户获得更好的体验,这是值得研究的重点。视频理解包括对视频分类、打标签等,面临的挑战有很多,如投稿量巨大、视频持续快速增长、覆盖范围广、产品影响大、算法要求高、问题种类多、样本极不均衡、问题区域小,解决方式也有很多,如人机耦合、多重审核机制、定制化模型。随后他还提到大规模视频分类和标签,他举出了一些需要用技术解决的例子,如筛选出一些无意义视频、黑屏视频等。对于视频中的 OCR 技术,他表示,有些问题很难,需要能精细检测和分割。最后,王长虎博士总结,计算机视觉技术除了在抖音上有广泛应用,还支撑着今日头条、火山小视频、西瓜视频。他表示,计算机视觉是抖音和今日头条很多产品的重要基石,希望更多老师和同学加入字节跳动公司。快手多媒体内容理解部负责人李岩是第三位上台嘉宾,他的演讲内容是《多模态内容生成与理解》。在演讲中,他为大家介绍了快手是一家怎样的公司,以及他们为什么要研究多模态内容生成与理解技术。快手多媒体内容理解部负责人李岩「即使你处在偏远的山村,也有希望通过快手的作品获得更多粉丝,消除孤独感,获得更多的连接。」李岩如是说道,他举了几个典型的快手视频案例来说明。快手有海量多模态数据,超过 70 亿条短视频数据,超过 150 亿条视频播放数据。他强调,多模态技术有两大应用,一是会改变人机交互方式,二是使得信息分发更加高效。但现在研究这样的问题还非常难,存在三大挑战,一是语义鸿沟,二是异构鸿沟(数据种类比较多),三是数据缺失(多模态数据非常难以构建)。他表示,快手也在一直努力,希望大家能更好地记录,让每个人成为自己生活的导演,希望记录的过程能便捷、个性化、有趣、普惠。他如下几个例子:自动字幕与智能配音。可以通过语音合成技术更好地满足记录需求,这会使记录更加便捷和有趣。随后他也详述了语音识别和合成技术,也提到目前用得比较多的深度学习技术。音乐自动生成技术。视频配乐相对来说还比较难。在视频音乐生成上涉及到非常多的技术,也有一些领域知识,如歌曲结构、歌曲速度、音乐基础要素,这可能需要研究音乐和计算机视觉的人互相配合。Animoji。大家可以通过快手直接在安卓手机上体验,降低了用户的体验成本。目前他们的技术可以敏锐地捕捉到面部表情变化,拉低了硬件门槛。最后他总结到,未来会有两个非常重要的方向:多模态特征对齐和多模态特征表示。他表达了如下三点展望:一是多模态会带来新的人机交互方式,二是多模态会带来新的内容形式,三是多模态急需新的算法和大型数据集。最后一位演讲嘉宾是北航计算机学院长江学者特聘教授李波,他的演讲主题为《面向公共安全的天空地网大数据一体化处理》。北航计算机学院长江学者特聘教授李波网络世界中新型犯罪活动层出不穷,比如电信或网络诈骗、跨境网络攻击等。外国军机非法侵入我国海域,仅利用航天成像无法获取目标的全面画像,可以将天空地网协同应用,利用互联网得到目标的更完整信息。李波教授提到利用天空网信息结合挖掘目标完整画像的案例,也谈到遥感图像与社交媒体融合以及美国在公共安全领域的研究与应用。随后,他提出了几项关键科技问题:天空地立体感知问题:空间尺度差异大,时效性差异大,视角差异大,分辨率差异大。 网络内容分析问题:网络形式多样、使用独立;网络内容繁杂;用户行为复杂,全貌模糊;行为轨迹碎片化。 天空地网数据综合应用问题:图像视频结构化描述简单;案件涉及多维度的关联分析,如时空关联、因果关联等。解决思路如下:基于时空关联的目标与事件检测在地面上,可以利用时空结合的场景语义分割;还可以通过天空地相互引导,实现立体感知。面向实体的跨网内容关联这里涉及到基于关键要素的敏感内容检测。在检测的基础上,可以进一步基于相似语义和时空关联的知识学习进行知识抽取,随后基于概念属性的跨网身份关联,实现跨网知识融合。虚实融合的一体化事件分析实是指物理世界,虚是指网络世界。可以生成实体-动作元事件模型,结合警务知识指导的事件分析,进行公共安全事件研判。李波教授的演讲结束之后迎来精彩的圆桌讨论环节,快手多媒体内容理解部负责人李岩、北航计算机学院长江学者特聘教授李波、字节跳动人工智能实验室总监王长虎、国家互联网应急中心张冬明纷纷上台,展开了更多对高通量媒体内容理解的探讨,现场观众也发表踊跃提问。随后,李波教授对今天的论坛做出总结,对在场观众表达了感谢。精彩的论坛就此结束,但对多媒体内容的探讨还在继续。图:洪日昌、李岩、李波、王长虎、张冬明(从左至右)雷锋网 AI 科技评论后续也将带来关于 CNCC 的一系列新闻,敬请关注。

瑞典保险公司Folksa数据泄露,近百万客户信息流入社交媒体
当地时间11月3日,瑞典最大的保险公司Folksa证实,近100万客户的个人信息已泄露给Facebook和Google等社交媒体。Folksam表示歉意,并已要求公司删除该信息。据Folksam的营销和销售主管Jens Wikström称,公司在一次内部审计后发现数据泄露,泄露信息包括敏感个人数据如个人社会保险账号等。此后,Folksam立即向瑞典数据保护局报告了这一事件。Wikström表示:“从Folksam接收个人数据的公司有Facebook、Google、Microsoft、Linkedin和Adobe。” 这些企业可以分析folksam的客户及其他访问者登录的信息,然后利用泄露数据的分析结果,向客户提供定制产品。“我们知道这会引起客户的关注,我们认真对待发生的事情。我们已立即停止共享个人信息,并要求将其删除。”Folksam营销和销售主管表示,“我们这样做的目的是分析并为客户提供定制的报价,但是不幸的是,我们没有以正确的方式做到这一点。”发现漏洞后,Folksam立即停止与其数字合作伙伴共享敏感信息,并要求接收信息的公司删除这些信息。目前,没有信息表明该信息已被第三方以任何不当方式使用。据彭博社报道,Folksam是瑞典最大的资产管理公司之一,负责监管500亿美元的保险资产。数据泄露时间频频发生,主要通过外部泄露和内部泄露两种方式。前不久,亚马逊解雇了违反公司政策向非关联第三方泄露客户数据(包括电子邮件地址)的员工。这次Folksam遭遇的本国客户数据大量泄露事件,会是什么原因导致?参考来源:https://www.bleepingcomputer.com/news/security/folksam-data-breach-leaks-info-of-1m-swedes-to-google-facebook-more/https://finance.sina.com.cn/tech/2020-11-04/doc-iiznezxr9773586.shtml
相关产品推荐