
人工智能
最近5G和AI叫得火爆,那么来科普下跨境电商AI第一课,爬虫
采集交流 • 优采云 发表了文章 • 0 个评论 • 216 次浏览 • 2020-07-01 08:01
之前写过一篇文章,
在5G和AI时代,所有的跨境电商生意都值得去再做一遍
调动了好多同学关于跨境电商AI化的热情和学习积极性。
这中间最有科技感和最热的一个词叫“爬虫”,
然后不停的有同事跟我们要爬虫数据和爬虫,这个是个太不专业的提问。
你们根本不知道什么叫“爬虫”,
大家要知道哪些是爬虫。
我们去做跨境电商,
最重要的一步就是做数据剖析,
做数据剖析最重要的组成就是剖析所做平台已有的销售数据,
我们看跨境电商的数据,一个是后台数据,一个是前台数据。 后台数据就是平台在后台给你看的这些店面数据,关键词指数数据,还有一些哪些推荐商品,每个平台都不一样。 前台数据是你看见的平台商品,商品销量,搜索词结果,销量那些。
为什么要有爬虫? 因为后台给你的只是冰山一角的数据,平台方对于每位品类销量排行第一到最后一个的商品理论上都是看得到的,但是他是不会给你的。 所以我们要做销售判定须要借助前台销量来做判定, 这个时侯就要用爬虫了, 为什么叫爬虫,因为象个蜘蛛一样把前台销量数据爬一遍。 是一个根据规则要求编辑的程序。 爬下来是个哪些东西? 基本都是一个Excel的表格,全部都是字符, 你根本看不懂也不需要去看。 爬虫只是数据剖析第一步。 第二步是做数据筛选, 也就是根据规则排序,例如某类目销量排序,
这中间“洗数据”的工作量是巨大的,
建立数据排序和规则也须要经验加上一点灵感, 还要做“可视化编辑”,也就是弄成你可以看见的网页,APP企图。 工程量巨大。 在多个软件工程师协作劳动之下才出了“选品工具”这个东西。
最后你还能用的,看到的才是这个东西:
大家可以看见,爬虫在整个流程中只是第一步,
市场上目前有好多爬虫工具,
爬虫规则你须要学习就能写,
爬虫规则写好了,
就须要调用云服务器,
这中间就开始了烧钱之旅,
你若果要爬取亚马逊或则ebay一个类目的商品数据,
云服务器费用就不是一笔小的数字,
爬的过程中还不是一帆风顺,
还要与平台的”反爬“斗智斗勇,写新的规则与”反爬“做对抗。
搞了这么多,
花了一大笔钱以后,
还只是初始数据。
进入到第二步筛选数据工作量特别大,
目前跨境电商的洗数据基本没有实现AI化,
大家只是写好几个规则,
例如把爬取的亚马逊珠宝这个类目下的30天,90天,180天销量做一个简单的排序,
然后给买家看。
或者降低”利润率“,”成本“几个维度。
所以这中间只解决了”什么销量高“的问题速卖通爬虫软件,
没有解决”未来哪些好卖”,“哪些商品值得去卖”的问题,
这部份基本还是靠有经验的选品营运人员按照已有数据去进行判别。
如果要实现AI化,
规则写好以后,
AI可以在这一步模拟人的学习,
然后不断的累积学习来实现选品人员的产品销售趋势的预判结果,
在这里AI虽然就是一个物理建模构建学习算法之后模拟人脑进行深度学习的过程,
(具体可以B站搜索“回形针“up主找到”如何用AI算法去预测一个官司你会不会赢“)
这个AI建模也是整套体系里的“皇冠上的明珠”,
几十行AI代码写出来,
几十百万。
所以可以写那些AI的人都进去百度腾讯阿里拿几十百万的月薪了,
大家认为有趣的话,
后面再写。
全文完
(The End)
以下内容富含广告,如继续阅读既表示你已接受可能遇见的广告,你乐意为从讯猫跨境获取免费知识而接受广告,且不存在任何不适以及争议。
欢迎出席我的知乎LIVE:
适合在家和兼职的跨境电商项目
小店家独立站逆袭跨境电商平台的形式
跨境电商怎样创业
跨境电商怎样选品
小白如何做好跨境电商?
外贸到跨境电商的13年创业
专注于跨境电商的“讯猫跨境电商天天说”,内容也太精彩噢!
欢迎阅读我其他的文章:
亦范:所有的挣钱门路都写在跨境电商平台“不容许”里-铺货撸羊绒怎么月入几万
亦范:跨境电商老买家是如何通过“铺货”来构建赢利模型,赚取高额利润的(2)
亦范:如何在ebay上找到热卖灵感,搬砖其他平台月入几万
亦范:干货-俚语词背后隐藏的巨大的流量和新品机会-Bachelorette
亦范:为什么推荐你们做Etsy(1)-流量,客单价,时间分配
亦范:做跨境电商出口亚马逊营运,是去鞋厂制造型的公司好,还是去跨境电商贸易公司好?
亦范:怎样从一个外贸业务员弄成自己的外贸公司?
外贸行业,三十多岁了,深圳,对前景倍感苦恼,希望知乎的高手指点迷津。? - 知乎
设计师怎样设计一款适宜国外市场的产品,并且是否有可能利用网上渠道在美国大卖? - 知乎
淘宝越来越难做了,不懂英文没有经验可以把东西卖国内吗? - 知乎
速卖通wish上2美元全球包邮是如何做到的速卖通爬虫软件,有收益吗? - 知乎外贸 B2C 国际快件如何操作的?
亚马逊搬砖买家-地图上的中国搬砖宝典
中小买家怎样在亚马逊一个类目使其他买家生无可恋
惊闻淘宝TOP500买家趁势杀入亚马逊-小卖如何办?
如何借助亚马逊BEST SELLER热卖属性构建新品
今天谈谈大家忽视的新品大户--美国买家 查看全部
在5G和AI时代,所有的跨境电商生意都值得去再做一遍
调动了好多同学关于跨境电商AI化的热情和学习积极性。
这中间最有科技感和最热的一个词叫“爬虫”,
然后不停的有同事跟我们要爬虫数据和爬虫,这个是个太不专业的提问。
你们根本不知道什么叫“爬虫”,
大家要知道哪些是爬虫。
我们去做跨境电商,
最重要的一步就是做数据剖析,
做数据剖析最重要的组成就是剖析所做平台已有的销售数据,
我们看跨境电商的数据,一个是后台数据,一个是前台数据。 后台数据就是平台在后台给你看的这些店面数据,关键词指数数据,还有一些哪些推荐商品,每个平台都不一样。 前台数据是你看见的平台商品,商品销量,搜索词结果,销量那些。
为什么要有爬虫? 因为后台给你的只是冰山一角的数据,平台方对于每位品类销量排行第一到最后一个的商品理论上都是看得到的,但是他是不会给你的。 所以我们要做销售判定须要借助前台销量来做判定, 这个时侯就要用爬虫了, 为什么叫爬虫,因为象个蜘蛛一样把前台销量数据爬一遍。 是一个根据规则要求编辑的程序。 爬下来是个哪些东西? 基本都是一个Excel的表格,全部都是字符, 你根本看不懂也不需要去看。 爬虫只是数据剖析第一步。 第二步是做数据筛选, 也就是根据规则排序,例如某类目销量排序,
这中间“洗数据”的工作量是巨大的,
建立数据排序和规则也须要经验加上一点灵感, 还要做“可视化编辑”,也就是弄成你可以看见的网页,APP企图。 工程量巨大。 在多个软件工程师协作劳动之下才出了“选品工具”这个东西。
最后你还能用的,看到的才是这个东西:
大家可以看见,爬虫在整个流程中只是第一步,
市场上目前有好多爬虫工具,
爬虫规则你须要学习就能写,
爬虫规则写好了,
就须要调用云服务器,
这中间就开始了烧钱之旅,
你若果要爬取亚马逊或则ebay一个类目的商品数据,
云服务器费用就不是一笔小的数字,
爬的过程中还不是一帆风顺,
还要与平台的”反爬“斗智斗勇,写新的规则与”反爬“做对抗。
搞了这么多,
花了一大笔钱以后,
还只是初始数据。
进入到第二步筛选数据工作量特别大,
目前跨境电商的洗数据基本没有实现AI化,
大家只是写好几个规则,
例如把爬取的亚马逊珠宝这个类目下的30天,90天,180天销量做一个简单的排序,
然后给买家看。
或者降低”利润率“,”成本“几个维度。
所以这中间只解决了”什么销量高“的问题速卖通爬虫软件,
没有解决”未来哪些好卖”,“哪些商品值得去卖”的问题,
这部份基本还是靠有经验的选品营运人员按照已有数据去进行判别。
如果要实现AI化,
规则写好以后,
AI可以在这一步模拟人的学习,
然后不断的累积学习来实现选品人员的产品销售趋势的预判结果,
在这里AI虽然就是一个物理建模构建学习算法之后模拟人脑进行深度学习的过程,
(具体可以B站搜索“回形针“up主找到”如何用AI算法去预测一个官司你会不会赢“)
这个AI建模也是整套体系里的“皇冠上的明珠”,
几十行AI代码写出来,
几十百万。
所以可以写那些AI的人都进去百度腾讯阿里拿几十百万的月薪了,
大家认为有趣的话,
后面再写。
全文完
(The End)
以下内容富含广告,如继续阅读既表示你已接受可能遇见的广告,你乐意为从讯猫跨境获取免费知识而接受广告,且不存在任何不适以及争议。
欢迎出席我的知乎LIVE:
适合在家和兼职的跨境电商项目
小店家独立站逆袭跨境电商平台的形式
跨境电商怎样创业
跨境电商怎样选品
小白如何做好跨境电商?
外贸到跨境电商的13年创业
专注于跨境电商的“讯猫跨境电商天天说”,内容也太精彩噢!
欢迎阅读我其他的文章:
亦范:所有的挣钱门路都写在跨境电商平台“不容许”里-铺货撸羊绒怎么月入几万
亦范:跨境电商老买家是如何通过“铺货”来构建赢利模型,赚取高额利润的(2)
亦范:如何在ebay上找到热卖灵感,搬砖其他平台月入几万
亦范:干货-俚语词背后隐藏的巨大的流量和新品机会-Bachelorette
亦范:为什么推荐你们做Etsy(1)-流量,客单价,时间分配
亦范:做跨境电商出口亚马逊营运,是去鞋厂制造型的公司好,还是去跨境电商贸易公司好?
亦范:怎样从一个外贸业务员弄成自己的外贸公司?
外贸行业,三十多岁了,深圳,对前景倍感苦恼,希望知乎的高手指点迷津。? - 知乎
设计师怎样设计一款适宜国外市场的产品,并且是否有可能利用网上渠道在美国大卖? - 知乎
淘宝越来越难做了,不懂英文没有经验可以把东西卖国内吗? - 知乎
速卖通wish上2美元全球包邮是如何做到的速卖通爬虫软件,有收益吗? - 知乎外贸 B2C 国际快件如何操作的?
亚马逊搬砖买家-地图上的中国搬砖宝典
中小买家怎样在亚马逊一个类目使其他买家生无可恋
惊闻淘宝TOP500买家趁势杀入亚马逊-小卖如何办?
如何借助亚马逊BEST SELLER热卖属性构建新品
今天谈谈大家忽视的新品大户--美国买家 查看全部
之前写过一篇文章,
在5G和AI时代,所有的跨境电商生意都值得去再做一遍
调动了好多同学关于跨境电商AI化的热情和学习积极性。
这中间最有科技感和最热的一个词叫“爬虫”,
然后不停的有同事跟我们要爬虫数据和爬虫,这个是个太不专业的提问。
你们根本不知道什么叫“爬虫”,
大家要知道哪些是爬虫。
我们去做跨境电商,
最重要的一步就是做数据剖析,
做数据剖析最重要的组成就是剖析所做平台已有的销售数据,
我们看跨境电商的数据,一个是后台数据,一个是前台数据。 后台数据就是平台在后台给你看的这些店面数据,关键词指数数据,还有一些哪些推荐商品,每个平台都不一样。 前台数据是你看见的平台商品,商品销量,搜索词结果,销量那些。

为什么要有爬虫? 因为后台给你的只是冰山一角的数据,平台方对于每位品类销量排行第一到最后一个的商品理论上都是看得到的,但是他是不会给你的。 所以我们要做销售判定须要借助前台销量来做判定, 这个时侯就要用爬虫了, 为什么叫爬虫,因为象个蜘蛛一样把前台销量数据爬一遍。 是一个根据规则要求编辑的程序。 爬下来是个哪些东西? 基本都是一个Excel的表格,全部都是字符, 你根本看不懂也不需要去看。 爬虫只是数据剖析第一步。 第二步是做数据筛选, 也就是根据规则排序,例如某类目销量排序,
这中间“洗数据”的工作量是巨大的,
建立数据排序和规则也须要经验加上一点灵感, 还要做“可视化编辑”,也就是弄成你可以看见的网页,APP企图。 工程量巨大。 在多个软件工程师协作劳动之下才出了“选品工具”这个东西。
最后你还能用的,看到的才是这个东西:


大家可以看见,爬虫在整个流程中只是第一步,
市场上目前有好多爬虫工具,
爬虫规则你须要学习就能写,
爬虫规则写好了,
就须要调用云服务器,
这中间就开始了烧钱之旅,
你若果要爬取亚马逊或则ebay一个类目的商品数据,
云服务器费用就不是一笔小的数字,
爬的过程中还不是一帆风顺,
还要与平台的”反爬“斗智斗勇,写新的规则与”反爬“做对抗。
搞了这么多,
花了一大笔钱以后,
还只是初始数据。
进入到第二步筛选数据工作量特别大,
目前跨境电商的洗数据基本没有实现AI化,
大家只是写好几个规则,
例如把爬取的亚马逊珠宝这个类目下的30天,90天,180天销量做一个简单的排序,
然后给买家看。
或者降低”利润率“,”成本“几个维度。
所以这中间只解决了”什么销量高“的问题速卖通爬虫软件,
没有解决”未来哪些好卖”,“哪些商品值得去卖”的问题,
这部份基本还是靠有经验的选品营运人员按照已有数据去进行判别。
如果要实现AI化,
规则写好以后,
AI可以在这一步模拟人的学习,
然后不断的累积学习来实现选品人员的产品销售趋势的预判结果,



在这里AI虽然就是一个物理建模构建学习算法之后模拟人脑进行深度学习的过程,
(具体可以B站搜索“回形针“up主找到”如何用AI算法去预测一个官司你会不会赢“)
这个AI建模也是整套体系里的“皇冠上的明珠”,
几十行AI代码写出来,
几十百万。
所以可以写那些AI的人都进去百度腾讯阿里拿几十百万的月薪了,
大家认为有趣的话,
后面再写。
全文完
(The End)
以下内容富含广告,如继续阅读既表示你已接受可能遇见的广告,你乐意为从讯猫跨境获取免费知识而接受广告,且不存在任何不适以及争议。
欢迎出席我的知乎LIVE:
适合在家和兼职的跨境电商项目
小店家独立站逆袭跨境电商平台的形式
跨境电商怎样创业
跨境电商怎样选品
小白如何做好跨境电商?
外贸到跨境电商的13年创业
专注于跨境电商的“讯猫跨境电商天天说”,内容也太精彩噢!

欢迎阅读我其他的文章:
亦范:所有的挣钱门路都写在跨境电商平台“不容许”里-铺货撸羊绒怎么月入几万

亦范:跨境电商老买家是如何通过“铺货”来构建赢利模型,赚取高额利润的(2)
亦范:如何在ebay上找到热卖灵感,搬砖其他平台月入几万

亦范:干货-俚语词背后隐藏的巨大的流量和新品机会-Bachelorette

亦范:为什么推荐你们做Etsy(1)-流量,客单价,时间分配

亦范:做跨境电商出口亚马逊营运,是去鞋厂制造型的公司好,还是去跨境电商贸易公司好?
亦范:怎样从一个外贸业务员弄成自己的外贸公司?
外贸行业,三十多岁了,深圳,对前景倍感苦恼,希望知乎的高手指点迷津。? - 知乎
设计师怎样设计一款适宜国外市场的产品,并且是否有可能利用网上渠道在美国大卖? - 知乎
淘宝越来越难做了,不懂英文没有经验可以把东西卖国内吗? - 知乎
速卖通wish上2美元全球包邮是如何做到的速卖通爬虫软件,有收益吗? - 知乎外贸 B2C 国际快件如何操作的?
亚马逊搬砖买家-地图上的中国搬砖宝典
中小买家怎样在亚马逊一个类目使其他买家生无可恋
惊闻淘宝TOP500买家趁势杀入亚马逊-小卖如何办?
如何借助亚马逊BEST SELLER热卖属性构建新品
今天谈谈大家忽视的新品大户--美国买家
内容科技:未来传媒的全新生产力
采集交流 • 优采云 发表了文章 • 0 个评论 • 338 次浏览 • 2020-04-01 11:11
【天极网IT新闻频道】3月27日,人民网组织编撰的《2019,内容科技(ConTech)元年》白皮书即将发布。报告强调,媒体发展的驱动力从以内容为主转变为以内容和技术双轮驱动,技术和内容越发紧密地结合在一起,技术在媒体发展中的作用显得空前重要;并基于“顶层构架注重内容与科技的结合——全媒体建设成为急迫任务——内容科技是建设全媒体重要手段路径”的逻辑推理,得出“2019成为内容元年”的论断。这是一个重要的命题,在这一命题之下,我国互联网发展的现实怎样呢?
图片来自网路
一、现实发展:内容与科技的融合不断深入
其实,不论是概念还是实践,内容科技都不能算是一个新鲜事,技术进步对提高传播效率、效果、效益和效能的重要作用毋庸置疑——从机械化到手动与电气化再到当下的信息化,现代技术的每一次革命都带来了媒体和传播的创新与发展,媒介形态与传播能力在技术变迁中升级迭代。即使把“内容科技(ConTech)”限定为大数据和人工智能等前沿信息技术(IT)以及物联网、5G、区块链等新兴通信技术(CT),“ConTech”的理念与机制也已经出现并落地实践。
2019年5月21日,腾讯全球数字生态会议上,腾讯公司副总裁陈菊红在《内容消费的规模陷井和ConTech新世界》的主题讲演中率先提出“ConTech”的概念。她强调,人工智能等技术对内容行业的改建早已初步完成,内容+人工智能将步入专业单向对接时代。腾讯新闻的目标在于以“可理解+可学习”为核心,构建一套内容从业者与内容AI之间的标准对话体系,实现从组织到业务的深度协同,与持续进化。她将腾讯新闻为防止流量圈套、寻找优质内容最优解而探求出的人机协作机制命名为“ConTech”,展示了腾讯新闻ConTech机制的三个主要流程:1.持续运转的内容筛选漏斗;2.关键内容的数据发觉和协同生产;3.有利于优质内容供应的高效机制。
图片来自网路
概念提出的背后是腾讯对人机协同提供优质内容的不断探求尝试。仅隔半年,2019年腾讯ConTech技术会议上,腾讯新闻算法负责人刘军宁分享了腾讯ConTech的技术布局与实践,涵盖内容的生产、准入、处理、分发到体验整个链条。在内容理解方面,贯穿全流程的内容理解力,除对内容基础语义的标签分类,逐渐向内容受众面、新闻性、知识性、事件脉络、知识图谱等深层次语义建立;在内容生产方面,青云智能内容生产引擎,承担素材检索、筛稿入库、内容纠错、摘要生成、自动写作、智能配图、短视频手动生成等辅助人工的工作;在内容分发方面,打造个性化、搜索、智能语音助手为依托的下一代的智能内容分发系统。可以说,贯穿于腾讯新闻ConTech的主线思路是人机协同,人的经验、智慧赋能给机器,用机器放大人的智慧,解放生产力,释放创造力。[1]其中,青云智能内容生产引擎的智能选装图系统,每日配图数目5.5万次;智能纠错模型,每日接到101万篇文章纠错需求;智能写作系统,年写作2.4亿字,年输出稿件107万篇。
腾讯ConTech实践正借助专业智慧和算法效率的共同进化,让用户收获更高的价值密度体验。例如,这次疫情中,腾讯新闻较真辟谣中台表现尤为亮眼。疫情期间,谣言随时出现,辟谣效率尤为关键。1月24日下午,腾讯新闻较真平台“新型冠状病毒脑炎”特别版上线,基于严格的鉴别体系和专家顾问的专业把关快速处理不同类型的网路谣言;还推出H5形态的“实时在线辟谣工具”,通过链接、长图、海报、短视频等形式,快速覆盖陌陌、微博、知乎等社交媒体平台。截至2月15日下午,“新型冠状病毒脑炎”特别版已为用户提供超过5.36亿次服务。这背后得益于较真辟谣中台的底层能力——较真中台搭建中央处理系统,利用AI等技术工具,将工业化的技术能力应用于高效的辟谣;一端接入海量的信息并对这种信息进行辨识和处理,另一端联接用户,将辟谣内容分发给用户。当前,腾讯新闻较真中台已集合谣言发觉与预警、谣言辨识与鉴别、辟谣生产与触达,以及谣言研究与科普四大能力。
图片来自网路
当然,内容与科技的融合实践主体除了限于平台型互联网机构,传统新闻媒体也在变革发展中抓住技术能力建设。纵观近年业界的媒体融合大潮,可以说内容生产分发相关技术的革新是各大媒体促使媒体融合的着力点与关键领域。例如,人民网基于自身内容错综复杂(7种少数民族语言及9种外文、60多类频道类型)的现实审视,为解决体系复杂、运营效率低、运维能力不足等疼点,建设了智能化应用平台,打造包括智能大数据服务和智能媒体应用在内的服务能力。“让数据多跑路,让人力少动手”,智能大数据服务一站式管理内容数据,智能媒体应用将技术基础与内容业务相结合上去,覆盖选题企划-新闻制做-内容初审-内容分发-传播剖析-版权追踪全链条。智能化应用平台的建设为人民网智能媒体融合提供了强悍的平台支撑,有效提升内容生产与内容营运效能。
二、未来趋势:技术对内容产业的赋能将成为未来发展的“风口”
当下,内容科技已围绕着信息采集、生产、分发、接收、反馈五个环节的智能化展开其应用,而随着5G技术商用开启的万物互联时代到来,技术对信息传播的改建向纵深处发展。高速率、高容量、低延时、低能耗的5G技术无疑是一项革命性的技术——它真正“连接一切”,将人与人、人与机器、人与世界的互联上升到生理级、心理级的互联互通,进一步拓展传播幅员、丰富传播要素、再造传播结构;它在传媒领域和传播领域的落地将会加速各类新技术对内容生产分发消费全链条的渗透,带来生产力的提高以及生产关系的解构。
1.采集:传感器拓展感官场域
万物互联环境下,智能化物体将成为信息的主要采集者。媒介是人体的延展,以传感为典型代表的信息采集工具就是人类感官的“延长”。传统新闻的信息采集主要借助记者的感官获取,但是此类方式有相当的局限性,而传感的应用能使新闻从业者更方便地获取海量且确切的数据,这除了有助于从大量复杂线索中发觉新颖的选题,还能够降低人为错误的形成。传感器一方面可以拓宽信息的来源途径,例如借助传感实时检测环境数据(包括气温、湿度等),甚至可以采集用户自发形成的生理数据(如脑电与脉搏)。另一方面,传感器还拓宽了信息的采集维度,包括时间维度与空间维度。[2]以无人机为例,5G技术将进一步赋于无人机超高清视频传输、低信噪比控制、远程联网协作和自主飞行等重要能力。
2.生产:机器生产内容海量涌现
万物互联和全时在线的数据通过数据挖掘和智能算法将生成海量的传感资讯,即MGC(机器生产内容)。所谓机器生产内容,即通过摄像头、传感器、无人机、行车记录仪等智能采集设备,结合新闻发生地附近的多维数据,自动检查新闻风波、自动生成数据新闻和富媒体资讯内容。让摄像头以及各类传感成为记者的耳朵,在突发事件和重大风波的捕捉和生成上,快人一步、自动生成。这一内容生产格局的巨大改变,势必会导致专业媒介工作者工作重心和工作逻辑的重大变革。专业传播工作者在未来传播中的主要价值角色的担当主要不是进行直接的内容生产,而是为用户生产内容(UGC)和机构生产内容(OGC)和机器生产内容(MGC)的内容生产创制模板、创新模式、开拓新的领域和新的功能、平衡社会抒发中的信息与意见失衡、建设传播领域的文化生态。[3]
3.分发:个人即时场景实现精准推送
如前文所说,传感器可以扩张从人到物的不同层面的信息采集力。万物互联状态下,人的空间位置、身体状态、运动状态甚至心理反应,在未来都可以通过传感或其他智能设备来侦测或描述微信文章自动采集软件,这为基于个人的即时场景的信息生产与推送提供了根据。目前算法技术早已才能通过搜集内容、环境以及用户等三个维度的信息来进行个性化推送,虽然对空间场景要素有所涉及,但应用还不够充分,也基本还未考虑用户实时状态、社交气氛等其他场景要素;在5G技术加持下,在深层次的人机交互基础之上基于私人场景的个性化服务将进一步提高,实现算法内容分发的“场景”增强。
4.触达:多元终端为用户提供沉浸式体验
5G的广接入下,信息接收终端将不再局限于个人联通终端(如智能手机)和家庭终端(如家庭大屏),可穿戴设备、智能家居、智能汽车等均有可能产生新的人机界面和交互方法。这些新型终端甩掉了屏幕限制,内容的接收和处理可通过多种感官体验实现,用户只需记住驱动智能设备的命令即可实现。同时,借5G 超高速的传输能力,可以解决VR/AR 在过去给受众带来的互动体验不强等问题,沉浸体验将进一步升级,人们在现实场景中能够体验到虚拟场景的沉浸感与在场感。[4]
5.反馈:数据采集将实现场景化、生理化
万物互联时代,用户反馈将愈加传感化;而传感将重新定义传播的反馈机制。一方面,用于检测内容反馈的智能工具可实现传播疗效数据采集的场景化,从延时模糊到即时精确;另一方面,对用户的洞察愈发细致全面——从浏览、评论、转载、点赞、关注等显性行为,到传感呈现的用户在信息消费过程中的生理反应。用户驱动的内容生产将会继续推进对用户需求和反馈的精准掌握。
总之微信文章自动采集软件,5G所造成的万物互联和全时在线的结果之一,就是无所不在的传感所生成的海量数据的泉涌。在未来的传播中,数据资源将成为传播驱动的最为关键性的资源和能量;实时生成的数据、实时剖析、实时调整的算法将成为整个信息系统运行的神经和命脉。掌握数据、价值挖掘、利用人工智能实用化,这恰恰就是未来职业传播工作者工作的重点与关键所在。
三、社会愿景:构建人机协同的内容科技未来生态
技术在给内容产业带来更多可能性的同时也埋伏了众多风险,如政治操控、社会歧视、隐私和产权侵害……当然,技术并非天生存恶。技术导致的危机,本质上还是人类自身的弊端缔造的;导致这种风险的重要诱因之一是技术趋于于工具理性主义,效率与利益成为最重要的标准,人文主义关爱逐渐淡化;也就是说,技术不断裹挟人类,人类的情感价值使坐落技术的工具价值,技术中心主义兴起。
人类首先要尊重人类自己,才能推动科技的人性化。必须听到在当下弱人工智能的技术现实下,人工智能及其相关技术尚处于知其然而不知其所以然、有估算而无理解的中级阶段——只能在数据层面发觉规律性模式、识别有价值的差别以及发觉数据的相关性,却未能象人类那样理解数据所蕴涵的信息语义等内涵及意义;智能化技术在内的各类新技术步入内容产业,是为了将人从一些简单、重复的劳动中解放下来,进一步提升人在其优势领域、关键领域的竞争力,旨在提高人类智能而非取代人类,人类的判定、道德和直觉对于各类智能体的关键决策不可或缺。简言之,无论内容科技带来何种程度地生产力飞越,传统的人工编辑仍饰演着“压舱石”“航向标”的角色;技术驱动的传播革命,并不是机器代替人的过程,而是“人—机”协作、共同进化的过程;人与机器之间的关系,应该更象是指挥家与乐团的关系,彼此互相协调、交互配合。
所谓人机协作,即通过技术发觉与补充人的能力局限,通过人的力量来纠正机器的怨愤与误区,这也是内容科技的价值取向。对于内容产业来说,在技术提供了高效率的前提下,我们更需要从人类生活、人性的目标来评判机器效率的意义。媒体在拥抱新技术的同时,需要做坚定的人文守望者;保持对人类生存意义和价值的关爱,以人为尺度,让技术更“正确”,更能服务于人的须要。以规则和人文精神来引导“技术向善”,或者说,推动内容科技向推动人类共同福祉的方向发展,将成为内容科技未来发展的基调。
概言之,人民网、腾讯网明天在内容科技(ConTech)上的“一小步”,其实就是整个传媒领域发展的“一大步”。让我们站在时代发展的低点上,认识和掌握内容科技(ConTech)发展的逻辑与趋势,这是决胜未来传播的一个关键。
[1]金融界.腾讯新闻ConTech合作伙伴计划 人机协同共建优质内容生态[EB/OL].
[2]喻国明,兰美娜,李玮.智能化:未来传播模式创新的核心逻辑——兼论“人工智能+媒体”的基本运作范式[J].新闻与写作,2017(03):41-45.
[3]喻国明.未来传播的三大关键变革——站在未来已来节点上的思索与展望[J].新闻与写作,2020(01):54-57.
[4]喻国明,陈雪娇,卢文婕,曹笑凡.边缘估算、5G与传播的未来融合——试论场景视阈下新闻传播过程的重新建立[J].传媒观察,2019(10):5-10.
(广告资讯) 查看全部

【天极网IT新闻频道】3月27日,人民网组织编撰的《2019,内容科技(ConTech)元年》白皮书即将发布。报告强调,媒体发展的驱动力从以内容为主转变为以内容和技术双轮驱动,技术和内容越发紧密地结合在一起,技术在媒体发展中的作用显得空前重要;并基于“顶层构架注重内容与科技的结合——全媒体建设成为急迫任务——内容科技是建设全媒体重要手段路径”的逻辑推理,得出“2019成为内容元年”的论断。这是一个重要的命题,在这一命题之下,我国互联网发展的现实怎样呢?

图片来自网路
一、现实发展:内容与科技的融合不断深入
其实,不论是概念还是实践,内容科技都不能算是一个新鲜事,技术进步对提高传播效率、效果、效益和效能的重要作用毋庸置疑——从机械化到手动与电气化再到当下的信息化,现代技术的每一次革命都带来了媒体和传播的创新与发展,媒介形态与传播能力在技术变迁中升级迭代。即使把“内容科技(ConTech)”限定为大数据和人工智能等前沿信息技术(IT)以及物联网、5G、区块链等新兴通信技术(CT),“ConTech”的理念与机制也已经出现并落地实践。
2019年5月21日,腾讯全球数字生态会议上,腾讯公司副总裁陈菊红在《内容消费的规模陷井和ConTech新世界》的主题讲演中率先提出“ConTech”的概念。她强调,人工智能等技术对内容行业的改建早已初步完成,内容+人工智能将步入专业单向对接时代。腾讯新闻的目标在于以“可理解+可学习”为核心,构建一套内容从业者与内容AI之间的标准对话体系,实现从组织到业务的深度协同,与持续进化。她将腾讯新闻为防止流量圈套、寻找优质内容最优解而探求出的人机协作机制命名为“ConTech”,展示了腾讯新闻ConTech机制的三个主要流程:1.持续运转的内容筛选漏斗;2.关键内容的数据发觉和协同生产;3.有利于优质内容供应的高效机制。

图片来自网路
概念提出的背后是腾讯对人机协同提供优质内容的不断探求尝试。仅隔半年,2019年腾讯ConTech技术会议上,腾讯新闻算法负责人刘军宁分享了腾讯ConTech的技术布局与实践,涵盖内容的生产、准入、处理、分发到体验整个链条。在内容理解方面,贯穿全流程的内容理解力,除对内容基础语义的标签分类,逐渐向内容受众面、新闻性、知识性、事件脉络、知识图谱等深层次语义建立;在内容生产方面,青云智能内容生产引擎,承担素材检索、筛稿入库、内容纠错、摘要生成、自动写作、智能配图、短视频手动生成等辅助人工的工作;在内容分发方面,打造个性化、搜索、智能语音助手为依托的下一代的智能内容分发系统。可以说,贯穿于腾讯新闻ConTech的主线思路是人机协同,人的经验、智慧赋能给机器,用机器放大人的智慧,解放生产力,释放创造力。[1]其中,青云智能内容生产引擎的智能选装图系统,每日配图数目5.5万次;智能纠错模型,每日接到101万篇文章纠错需求;智能写作系统,年写作2.4亿字,年输出稿件107万篇。
腾讯ConTech实践正借助专业智慧和算法效率的共同进化,让用户收获更高的价值密度体验。例如,这次疫情中,腾讯新闻较真辟谣中台表现尤为亮眼。疫情期间,谣言随时出现,辟谣效率尤为关键。1月24日下午,腾讯新闻较真平台“新型冠状病毒脑炎”特别版上线,基于严格的鉴别体系和专家顾问的专业把关快速处理不同类型的网路谣言;还推出H5形态的“实时在线辟谣工具”,通过链接、长图、海报、短视频等形式,快速覆盖陌陌、微博、知乎等社交媒体平台。截至2月15日下午,“新型冠状病毒脑炎”特别版已为用户提供超过5.36亿次服务。这背后得益于较真辟谣中台的底层能力——较真中台搭建中央处理系统,利用AI等技术工具,将工业化的技术能力应用于高效的辟谣;一端接入海量的信息并对这种信息进行辨识和处理,另一端联接用户,将辟谣内容分发给用户。当前,腾讯新闻较真中台已集合谣言发觉与预警、谣言辨识与鉴别、辟谣生产与触达,以及谣言研究与科普四大能力。

图片来自网路
当然,内容与科技的融合实践主体除了限于平台型互联网机构,传统新闻媒体也在变革发展中抓住技术能力建设。纵观近年业界的媒体融合大潮,可以说内容生产分发相关技术的革新是各大媒体促使媒体融合的着力点与关键领域。例如,人民网基于自身内容错综复杂(7种少数民族语言及9种外文、60多类频道类型)的现实审视,为解决体系复杂、运营效率低、运维能力不足等疼点,建设了智能化应用平台,打造包括智能大数据服务和智能媒体应用在内的服务能力。“让数据多跑路,让人力少动手”,智能大数据服务一站式管理内容数据,智能媒体应用将技术基础与内容业务相结合上去,覆盖选题企划-新闻制做-内容初审-内容分发-传播剖析-版权追踪全链条。智能化应用平台的建设为人民网智能媒体融合提供了强悍的平台支撑,有效提升内容生产与内容营运效能。
二、未来趋势:技术对内容产业的赋能将成为未来发展的“风口”
当下,内容科技已围绕着信息采集、生产、分发、接收、反馈五个环节的智能化展开其应用,而随着5G技术商用开启的万物互联时代到来,技术对信息传播的改建向纵深处发展。高速率、高容量、低延时、低能耗的5G技术无疑是一项革命性的技术——它真正“连接一切”,将人与人、人与机器、人与世界的互联上升到生理级、心理级的互联互通,进一步拓展传播幅员、丰富传播要素、再造传播结构;它在传媒领域和传播领域的落地将会加速各类新技术对内容生产分发消费全链条的渗透,带来生产力的提高以及生产关系的解构。
1.采集:传感器拓展感官场域
万物互联环境下,智能化物体将成为信息的主要采集者。媒介是人体的延展,以传感为典型代表的信息采集工具就是人类感官的“延长”。传统新闻的信息采集主要借助记者的感官获取,但是此类方式有相当的局限性,而传感的应用能使新闻从业者更方便地获取海量且确切的数据,这除了有助于从大量复杂线索中发觉新颖的选题,还能够降低人为错误的形成。传感器一方面可以拓宽信息的来源途径,例如借助传感实时检测环境数据(包括气温、湿度等),甚至可以采集用户自发形成的生理数据(如脑电与脉搏)。另一方面,传感器还拓宽了信息的采集维度,包括时间维度与空间维度。[2]以无人机为例,5G技术将进一步赋于无人机超高清视频传输、低信噪比控制、远程联网协作和自主飞行等重要能力。
2.生产:机器生产内容海量涌现
万物互联和全时在线的数据通过数据挖掘和智能算法将生成海量的传感资讯,即MGC(机器生产内容)。所谓机器生产内容,即通过摄像头、传感器、无人机、行车记录仪等智能采集设备,结合新闻发生地附近的多维数据,自动检查新闻风波、自动生成数据新闻和富媒体资讯内容。让摄像头以及各类传感成为记者的耳朵,在突发事件和重大风波的捕捉和生成上,快人一步、自动生成。这一内容生产格局的巨大改变,势必会导致专业媒介工作者工作重心和工作逻辑的重大变革。专业传播工作者在未来传播中的主要价值角色的担当主要不是进行直接的内容生产,而是为用户生产内容(UGC)和机构生产内容(OGC)和机器生产内容(MGC)的内容生产创制模板、创新模式、开拓新的领域和新的功能、平衡社会抒发中的信息与意见失衡、建设传播领域的文化生态。[3]
3.分发:个人即时场景实现精准推送
如前文所说,传感器可以扩张从人到物的不同层面的信息采集力。万物互联状态下,人的空间位置、身体状态、运动状态甚至心理反应,在未来都可以通过传感或其他智能设备来侦测或描述微信文章自动采集软件,这为基于个人的即时场景的信息生产与推送提供了根据。目前算法技术早已才能通过搜集内容、环境以及用户等三个维度的信息来进行个性化推送,虽然对空间场景要素有所涉及,但应用还不够充分,也基本还未考虑用户实时状态、社交气氛等其他场景要素;在5G技术加持下,在深层次的人机交互基础之上基于私人场景的个性化服务将进一步提高,实现算法内容分发的“场景”增强。
4.触达:多元终端为用户提供沉浸式体验
5G的广接入下,信息接收终端将不再局限于个人联通终端(如智能手机)和家庭终端(如家庭大屏),可穿戴设备、智能家居、智能汽车等均有可能产生新的人机界面和交互方法。这些新型终端甩掉了屏幕限制,内容的接收和处理可通过多种感官体验实现,用户只需记住驱动智能设备的命令即可实现。同时,借5G 超高速的传输能力,可以解决VR/AR 在过去给受众带来的互动体验不强等问题,沉浸体验将进一步升级,人们在现实场景中能够体验到虚拟场景的沉浸感与在场感。[4]
5.反馈:数据采集将实现场景化、生理化
万物互联时代,用户反馈将愈加传感化;而传感将重新定义传播的反馈机制。一方面,用于检测内容反馈的智能工具可实现传播疗效数据采集的场景化,从延时模糊到即时精确;另一方面,对用户的洞察愈发细致全面——从浏览、评论、转载、点赞、关注等显性行为,到传感呈现的用户在信息消费过程中的生理反应。用户驱动的内容生产将会继续推进对用户需求和反馈的精准掌握。
总之微信文章自动采集软件,5G所造成的万物互联和全时在线的结果之一,就是无所不在的传感所生成的海量数据的泉涌。在未来的传播中,数据资源将成为传播驱动的最为关键性的资源和能量;实时生成的数据、实时剖析、实时调整的算法将成为整个信息系统运行的神经和命脉。掌握数据、价值挖掘、利用人工智能实用化,这恰恰就是未来职业传播工作者工作的重点与关键所在。
三、社会愿景:构建人机协同的内容科技未来生态
技术在给内容产业带来更多可能性的同时也埋伏了众多风险,如政治操控、社会歧视、隐私和产权侵害……当然,技术并非天生存恶。技术导致的危机,本质上还是人类自身的弊端缔造的;导致这种风险的重要诱因之一是技术趋于于工具理性主义,效率与利益成为最重要的标准,人文主义关爱逐渐淡化;也就是说,技术不断裹挟人类,人类的情感价值使坐落技术的工具价值,技术中心主义兴起。
人类首先要尊重人类自己,才能推动科技的人性化。必须听到在当下弱人工智能的技术现实下,人工智能及其相关技术尚处于知其然而不知其所以然、有估算而无理解的中级阶段——只能在数据层面发觉规律性模式、识别有价值的差别以及发觉数据的相关性,却未能象人类那样理解数据所蕴涵的信息语义等内涵及意义;智能化技术在内的各类新技术步入内容产业,是为了将人从一些简单、重复的劳动中解放下来,进一步提升人在其优势领域、关键领域的竞争力,旨在提高人类智能而非取代人类,人类的判定、道德和直觉对于各类智能体的关键决策不可或缺。简言之,无论内容科技带来何种程度地生产力飞越,传统的人工编辑仍饰演着“压舱石”“航向标”的角色;技术驱动的传播革命,并不是机器代替人的过程,而是“人—机”协作、共同进化的过程;人与机器之间的关系,应该更象是指挥家与乐团的关系,彼此互相协调、交互配合。
所谓人机协作,即通过技术发觉与补充人的能力局限,通过人的力量来纠正机器的怨愤与误区,这也是内容科技的价值取向。对于内容产业来说,在技术提供了高效率的前提下,我们更需要从人类生活、人性的目标来评判机器效率的意义。媒体在拥抱新技术的同时,需要做坚定的人文守望者;保持对人类生存意义和价值的关爱,以人为尺度,让技术更“正确”,更能服务于人的须要。以规则和人文精神来引导“技术向善”,或者说,推动内容科技向推动人类共同福祉的方向发展,将成为内容科技未来发展的基调。
概言之,人民网、腾讯网明天在内容科技(ConTech)上的“一小步”,其实就是整个传媒领域发展的“一大步”。让我们站在时代发展的低点上,认识和掌握内容科技(ConTech)发展的逻辑与趋势,这是决胜未来传播的一个关键。
[1]金融界.腾讯新闻ConTech合作伙伴计划 人机协同共建优质内容生态[EB/OL].
[2]喻国明,兰美娜,李玮.智能化:未来传播模式创新的核心逻辑——兼论“人工智能+媒体”的基本运作范式[J].新闻与写作,2017(03):41-45.
[3]喻国明.未来传播的三大关键变革——站在未来已来节点上的思索与展望[J].新闻与写作,2020(01):54-57.
[4]喻国明,陈雪娇,卢文婕,曹笑凡.边缘估算、5G与传播的未来融合——试论场景视阈下新闻传播过程的重新建立[J].传媒观察,2019(10):5-10.
(广告资讯)
最近5G和AI叫得火爆,那么来科普下跨境电商AI第一课,爬虫
采集交流 • 优采云 发表了文章 • 0 个评论 • 216 次浏览 • 2020-07-01 08:01
之前写过一篇文章,
在5G和AI时代,所有的跨境电商生意都值得去再做一遍
调动了好多同学关于跨境电商AI化的热情和学习积极性。
这中间最有科技感和最热的一个词叫“爬虫”,
然后不停的有同事跟我们要爬虫数据和爬虫,这个是个太不专业的提问。
你们根本不知道什么叫“爬虫”,
大家要知道哪些是爬虫。
我们去做跨境电商,
最重要的一步就是做数据剖析,
做数据剖析最重要的组成就是剖析所做平台已有的销售数据,
我们看跨境电商的数据,一个是后台数据,一个是前台数据。 后台数据就是平台在后台给你看的这些店面数据,关键词指数数据,还有一些哪些推荐商品,每个平台都不一样。 前台数据是你看见的平台商品,商品销量,搜索词结果,销量那些。
为什么要有爬虫? 因为后台给你的只是冰山一角的数据,平台方对于每位品类销量排行第一到最后一个的商品理论上都是看得到的,但是他是不会给你的。 所以我们要做销售判定须要借助前台销量来做判定, 这个时侯就要用爬虫了, 为什么叫爬虫,因为象个蜘蛛一样把前台销量数据爬一遍。 是一个根据规则要求编辑的程序。 爬下来是个哪些东西? 基本都是一个Excel的表格,全部都是字符, 你根本看不懂也不需要去看。 爬虫只是数据剖析第一步。 第二步是做数据筛选, 也就是根据规则排序,例如某类目销量排序,
这中间“洗数据”的工作量是巨大的,
建立数据排序和规则也须要经验加上一点灵感, 还要做“可视化编辑”,也就是弄成你可以看见的网页,APP企图。 工程量巨大。 在多个软件工程师协作劳动之下才出了“选品工具”这个东西。
最后你还能用的,看到的才是这个东西:
大家可以看见,爬虫在整个流程中只是第一步,
市场上目前有好多爬虫工具,
爬虫规则你须要学习就能写,
爬虫规则写好了,
就须要调用云服务器,
这中间就开始了烧钱之旅,
你若果要爬取亚马逊或则ebay一个类目的商品数据,
云服务器费用就不是一笔小的数字,
爬的过程中还不是一帆风顺,
还要与平台的”反爬“斗智斗勇,写新的规则与”反爬“做对抗。
搞了这么多,
花了一大笔钱以后,
还只是初始数据。
进入到第二步筛选数据工作量特别大,
目前跨境电商的洗数据基本没有实现AI化,
大家只是写好几个规则,
例如把爬取的亚马逊珠宝这个类目下的30天,90天,180天销量做一个简单的排序,
然后给买家看。
或者降低”利润率“,”成本“几个维度。
所以这中间只解决了”什么销量高“的问题速卖通爬虫软件,
没有解决”未来哪些好卖”,“哪些商品值得去卖”的问题,
这部份基本还是靠有经验的选品营运人员按照已有数据去进行判别。
如果要实现AI化,
规则写好以后,
AI可以在这一步模拟人的学习,
然后不断的累积学习来实现选品人员的产品销售趋势的预判结果,
在这里AI虽然就是一个物理建模构建学习算法之后模拟人脑进行深度学习的过程,
(具体可以B站搜索“回形针“up主找到”如何用AI算法去预测一个官司你会不会赢“)
这个AI建模也是整套体系里的“皇冠上的明珠”,
几十行AI代码写出来,
几十百万。
所以可以写那些AI的人都进去百度腾讯阿里拿几十百万的月薪了,
大家认为有趣的话,
后面再写。
全文完
(The End)
以下内容富含广告,如继续阅读既表示你已接受可能遇见的广告,你乐意为从讯猫跨境获取免费知识而接受广告,且不存在任何不适以及争议。
欢迎出席我的知乎LIVE:
适合在家和兼职的跨境电商项目
小店家独立站逆袭跨境电商平台的形式
跨境电商怎样创业
跨境电商怎样选品
小白如何做好跨境电商?
外贸到跨境电商的13年创业
专注于跨境电商的“讯猫跨境电商天天说”,内容也太精彩噢!
欢迎阅读我其他的文章:
亦范:所有的挣钱门路都写在跨境电商平台“不容许”里-铺货撸羊绒怎么月入几万
亦范:跨境电商老买家是如何通过“铺货”来构建赢利模型,赚取高额利润的(2)
亦范:如何在ebay上找到热卖灵感,搬砖其他平台月入几万
亦范:干货-俚语词背后隐藏的巨大的流量和新品机会-Bachelorette
亦范:为什么推荐你们做Etsy(1)-流量,客单价,时间分配
亦范:做跨境电商出口亚马逊营运,是去鞋厂制造型的公司好,还是去跨境电商贸易公司好?
亦范:怎样从一个外贸业务员弄成自己的外贸公司?
外贸行业,三十多岁了,深圳,对前景倍感苦恼,希望知乎的高手指点迷津。? - 知乎
设计师怎样设计一款适宜国外市场的产品,并且是否有可能利用网上渠道在美国大卖? - 知乎
淘宝越来越难做了,不懂英文没有经验可以把东西卖国内吗? - 知乎
速卖通wish上2美元全球包邮是如何做到的速卖通爬虫软件,有收益吗? - 知乎外贸 B2C 国际快件如何操作的?
亚马逊搬砖买家-地图上的中国搬砖宝典
中小买家怎样在亚马逊一个类目使其他买家生无可恋
惊闻淘宝TOP500买家趁势杀入亚马逊-小卖如何办?
如何借助亚马逊BEST SELLER热卖属性构建新品
今天谈谈大家忽视的新品大户--美国买家 查看全部
在5G和AI时代,所有的跨境电商生意都值得去再做一遍
调动了好多同学关于跨境电商AI化的热情和学习积极性。
这中间最有科技感和最热的一个词叫“爬虫”,
然后不停的有同事跟我们要爬虫数据和爬虫,这个是个太不专业的提问。
你们根本不知道什么叫“爬虫”,
大家要知道哪些是爬虫。
我们去做跨境电商,
最重要的一步就是做数据剖析,
做数据剖析最重要的组成就是剖析所做平台已有的销售数据,
我们看跨境电商的数据,一个是后台数据,一个是前台数据。 后台数据就是平台在后台给你看的这些店面数据,关键词指数数据,还有一些哪些推荐商品,每个平台都不一样。 前台数据是你看见的平台商品,商品销量,搜索词结果,销量那些。
为什么要有爬虫? 因为后台给你的只是冰山一角的数据,平台方对于每位品类销量排行第一到最后一个的商品理论上都是看得到的,但是他是不会给你的。 所以我们要做销售判定须要借助前台销量来做判定, 这个时侯就要用爬虫了, 为什么叫爬虫,因为象个蜘蛛一样把前台销量数据爬一遍。 是一个根据规则要求编辑的程序。 爬下来是个哪些东西? 基本都是一个Excel的表格,全部都是字符, 你根本看不懂也不需要去看。 爬虫只是数据剖析第一步。 第二步是做数据筛选, 也就是根据规则排序,例如某类目销量排序,
这中间“洗数据”的工作量是巨大的,
建立数据排序和规则也须要经验加上一点灵感, 还要做“可视化编辑”,也就是弄成你可以看见的网页,APP企图。 工程量巨大。 在多个软件工程师协作劳动之下才出了“选品工具”这个东西。
最后你还能用的,看到的才是这个东西:
大家可以看见,爬虫在整个流程中只是第一步,
市场上目前有好多爬虫工具,
爬虫规则你须要学习就能写,
爬虫规则写好了,
就须要调用云服务器,
这中间就开始了烧钱之旅,
你若果要爬取亚马逊或则ebay一个类目的商品数据,
云服务器费用就不是一笔小的数字,
爬的过程中还不是一帆风顺,
还要与平台的”反爬“斗智斗勇,写新的规则与”反爬“做对抗。
搞了这么多,
花了一大笔钱以后,
还只是初始数据。
进入到第二步筛选数据工作量特别大,
目前跨境电商的洗数据基本没有实现AI化,
大家只是写好几个规则,
例如把爬取的亚马逊珠宝这个类目下的30天,90天,180天销量做一个简单的排序,
然后给买家看。
或者降低”利润率“,”成本“几个维度。
所以这中间只解决了”什么销量高“的问题速卖通爬虫软件,
没有解决”未来哪些好卖”,“哪些商品值得去卖”的问题,
这部份基本还是靠有经验的选品营运人员按照已有数据去进行判别。
如果要实现AI化,
规则写好以后,
AI可以在这一步模拟人的学习,
然后不断的累积学习来实现选品人员的产品销售趋势的预判结果,
在这里AI虽然就是一个物理建模构建学习算法之后模拟人脑进行深度学习的过程,
(具体可以B站搜索“回形针“up主找到”如何用AI算法去预测一个官司你会不会赢“)
这个AI建模也是整套体系里的“皇冠上的明珠”,
几十行AI代码写出来,
几十百万。
所以可以写那些AI的人都进去百度腾讯阿里拿几十百万的月薪了,
大家认为有趣的话,
后面再写。
全文完
(The End)
以下内容富含广告,如继续阅读既表示你已接受可能遇见的广告,你乐意为从讯猫跨境获取免费知识而接受广告,且不存在任何不适以及争议。
欢迎出席我的知乎LIVE:
适合在家和兼职的跨境电商项目
小店家独立站逆袭跨境电商平台的形式
跨境电商怎样创业
跨境电商怎样选品
小白如何做好跨境电商?
外贸到跨境电商的13年创业
专注于跨境电商的“讯猫跨境电商天天说”,内容也太精彩噢!
欢迎阅读我其他的文章:
亦范:所有的挣钱门路都写在跨境电商平台“不容许”里-铺货撸羊绒怎么月入几万
亦范:跨境电商老买家是如何通过“铺货”来构建赢利模型,赚取高额利润的(2)
亦范:如何在ebay上找到热卖灵感,搬砖其他平台月入几万
亦范:干货-俚语词背后隐藏的巨大的流量和新品机会-Bachelorette
亦范:为什么推荐你们做Etsy(1)-流量,客单价,时间分配
亦范:做跨境电商出口亚马逊营运,是去鞋厂制造型的公司好,还是去跨境电商贸易公司好?
亦范:怎样从一个外贸业务员弄成自己的外贸公司?
外贸行业,三十多岁了,深圳,对前景倍感苦恼,希望知乎的高手指点迷津。? - 知乎
设计师怎样设计一款适宜国外市场的产品,并且是否有可能利用网上渠道在美国大卖? - 知乎
淘宝越来越难做了,不懂英文没有经验可以把东西卖国内吗? - 知乎
速卖通wish上2美元全球包邮是如何做到的速卖通爬虫软件,有收益吗? - 知乎外贸 B2C 国际快件如何操作的?
亚马逊搬砖买家-地图上的中国搬砖宝典
中小买家怎样在亚马逊一个类目使其他买家生无可恋
惊闻淘宝TOP500买家趁势杀入亚马逊-小卖如何办?
如何借助亚马逊BEST SELLER热卖属性构建新品
今天谈谈大家忽视的新品大户--美国买家 查看全部
之前写过一篇文章,
在5G和AI时代,所有的跨境电商生意都值得去再做一遍
调动了好多同学关于跨境电商AI化的热情和学习积极性。
这中间最有科技感和最热的一个词叫“爬虫”,
然后不停的有同事跟我们要爬虫数据和爬虫,这个是个太不专业的提问。
你们根本不知道什么叫“爬虫”,
大家要知道哪些是爬虫。
我们去做跨境电商,
最重要的一步就是做数据剖析,
做数据剖析最重要的组成就是剖析所做平台已有的销售数据,
我们看跨境电商的数据,一个是后台数据,一个是前台数据。 后台数据就是平台在后台给你看的这些店面数据,关键词指数数据,还有一些哪些推荐商品,每个平台都不一样。 前台数据是你看见的平台商品,商品销量,搜索词结果,销量那些。

为什么要有爬虫? 因为后台给你的只是冰山一角的数据,平台方对于每位品类销量排行第一到最后一个的商品理论上都是看得到的,但是他是不会给你的。 所以我们要做销售判定须要借助前台销量来做判定, 这个时侯就要用爬虫了, 为什么叫爬虫,因为象个蜘蛛一样把前台销量数据爬一遍。 是一个根据规则要求编辑的程序。 爬下来是个哪些东西? 基本都是一个Excel的表格,全部都是字符, 你根本看不懂也不需要去看。 爬虫只是数据剖析第一步。 第二步是做数据筛选, 也就是根据规则排序,例如某类目销量排序,
这中间“洗数据”的工作量是巨大的,
建立数据排序和规则也须要经验加上一点灵感, 还要做“可视化编辑”,也就是弄成你可以看见的网页,APP企图。 工程量巨大。 在多个软件工程师协作劳动之下才出了“选品工具”这个东西。
最后你还能用的,看到的才是这个东西:


大家可以看见,爬虫在整个流程中只是第一步,
市场上目前有好多爬虫工具,
爬虫规则你须要学习就能写,
爬虫规则写好了,
就须要调用云服务器,
这中间就开始了烧钱之旅,
你若果要爬取亚马逊或则ebay一个类目的商品数据,
云服务器费用就不是一笔小的数字,
爬的过程中还不是一帆风顺,
还要与平台的”反爬“斗智斗勇,写新的规则与”反爬“做对抗。
搞了这么多,
花了一大笔钱以后,
还只是初始数据。
进入到第二步筛选数据工作量特别大,
目前跨境电商的洗数据基本没有实现AI化,
大家只是写好几个规则,
例如把爬取的亚马逊珠宝这个类目下的30天,90天,180天销量做一个简单的排序,
然后给买家看。
或者降低”利润率“,”成本“几个维度。
所以这中间只解决了”什么销量高“的问题速卖通爬虫软件,
没有解决”未来哪些好卖”,“哪些商品值得去卖”的问题,
这部份基本还是靠有经验的选品营运人员按照已有数据去进行判别。
如果要实现AI化,
规则写好以后,
AI可以在这一步模拟人的学习,
然后不断的累积学习来实现选品人员的产品销售趋势的预判结果,



在这里AI虽然就是一个物理建模构建学习算法之后模拟人脑进行深度学习的过程,
(具体可以B站搜索“回形针“up主找到”如何用AI算法去预测一个官司你会不会赢“)
这个AI建模也是整套体系里的“皇冠上的明珠”,
几十行AI代码写出来,
几十百万。
所以可以写那些AI的人都进去百度腾讯阿里拿几十百万的月薪了,
大家认为有趣的话,
后面再写。
全文完
(The End)
以下内容富含广告,如继续阅读既表示你已接受可能遇见的广告,你乐意为从讯猫跨境获取免费知识而接受广告,且不存在任何不适以及争议。
欢迎出席我的知乎LIVE:
适合在家和兼职的跨境电商项目
小店家独立站逆袭跨境电商平台的形式
跨境电商怎样创业
跨境电商怎样选品
小白如何做好跨境电商?
外贸到跨境电商的13年创业
专注于跨境电商的“讯猫跨境电商天天说”,内容也太精彩噢!

欢迎阅读我其他的文章:
亦范:所有的挣钱门路都写在跨境电商平台“不容许”里-铺货撸羊绒怎么月入几万

亦范:跨境电商老买家是如何通过“铺货”来构建赢利模型,赚取高额利润的(2)
亦范:如何在ebay上找到热卖灵感,搬砖其他平台月入几万

亦范:干货-俚语词背后隐藏的巨大的流量和新品机会-Bachelorette

亦范:为什么推荐你们做Etsy(1)-流量,客单价,时间分配

亦范:做跨境电商出口亚马逊营运,是去鞋厂制造型的公司好,还是去跨境电商贸易公司好?
亦范:怎样从一个外贸业务员弄成自己的外贸公司?
外贸行业,三十多岁了,深圳,对前景倍感苦恼,希望知乎的高手指点迷津。? - 知乎
设计师怎样设计一款适宜国外市场的产品,并且是否有可能利用网上渠道在美国大卖? - 知乎
淘宝越来越难做了,不懂英文没有经验可以把东西卖国内吗? - 知乎
速卖通wish上2美元全球包邮是如何做到的速卖通爬虫软件,有收益吗? - 知乎外贸 B2C 国际快件如何操作的?
亚马逊搬砖买家-地图上的中国搬砖宝典
中小买家怎样在亚马逊一个类目使其他买家生无可恋
惊闻淘宝TOP500买家趁势杀入亚马逊-小卖如何办?
如何借助亚马逊BEST SELLER热卖属性构建新品
今天谈谈大家忽视的新品大户--美国买家
内容科技:未来传媒的全新生产力
采集交流 • 优采云 发表了文章 • 0 个评论 • 338 次浏览 • 2020-04-01 11:11
【天极网IT新闻频道】3月27日,人民网组织编撰的《2019,内容科技(ConTech)元年》白皮书即将发布。报告强调,媒体发展的驱动力从以内容为主转变为以内容和技术双轮驱动,技术和内容越发紧密地结合在一起,技术在媒体发展中的作用显得空前重要;并基于“顶层构架注重内容与科技的结合——全媒体建设成为急迫任务——内容科技是建设全媒体重要手段路径”的逻辑推理,得出“2019成为内容元年”的论断。这是一个重要的命题,在这一命题之下,我国互联网发展的现实怎样呢?
图片来自网路
一、现实发展:内容与科技的融合不断深入
其实,不论是概念还是实践,内容科技都不能算是一个新鲜事,技术进步对提高传播效率、效果、效益和效能的重要作用毋庸置疑——从机械化到手动与电气化再到当下的信息化,现代技术的每一次革命都带来了媒体和传播的创新与发展,媒介形态与传播能力在技术变迁中升级迭代。即使把“内容科技(ConTech)”限定为大数据和人工智能等前沿信息技术(IT)以及物联网、5G、区块链等新兴通信技术(CT),“ConTech”的理念与机制也已经出现并落地实践。
2019年5月21日,腾讯全球数字生态会议上,腾讯公司副总裁陈菊红在《内容消费的规模陷井和ConTech新世界》的主题讲演中率先提出“ConTech”的概念。她强调,人工智能等技术对内容行业的改建早已初步完成,内容+人工智能将步入专业单向对接时代。腾讯新闻的目标在于以“可理解+可学习”为核心,构建一套内容从业者与内容AI之间的标准对话体系,实现从组织到业务的深度协同,与持续进化。她将腾讯新闻为防止流量圈套、寻找优质内容最优解而探求出的人机协作机制命名为“ConTech”,展示了腾讯新闻ConTech机制的三个主要流程:1.持续运转的内容筛选漏斗;2.关键内容的数据发觉和协同生产;3.有利于优质内容供应的高效机制。
图片来自网路
概念提出的背后是腾讯对人机协同提供优质内容的不断探求尝试。仅隔半年,2019年腾讯ConTech技术会议上,腾讯新闻算法负责人刘军宁分享了腾讯ConTech的技术布局与实践,涵盖内容的生产、准入、处理、分发到体验整个链条。在内容理解方面,贯穿全流程的内容理解力,除对内容基础语义的标签分类,逐渐向内容受众面、新闻性、知识性、事件脉络、知识图谱等深层次语义建立;在内容生产方面,青云智能内容生产引擎,承担素材检索、筛稿入库、内容纠错、摘要生成、自动写作、智能配图、短视频手动生成等辅助人工的工作;在内容分发方面,打造个性化、搜索、智能语音助手为依托的下一代的智能内容分发系统。可以说,贯穿于腾讯新闻ConTech的主线思路是人机协同,人的经验、智慧赋能给机器,用机器放大人的智慧,解放生产力,释放创造力。[1]其中,青云智能内容生产引擎的智能选装图系统,每日配图数目5.5万次;智能纠错模型,每日接到101万篇文章纠错需求;智能写作系统,年写作2.4亿字,年输出稿件107万篇。
腾讯ConTech实践正借助专业智慧和算法效率的共同进化,让用户收获更高的价值密度体验。例如,这次疫情中,腾讯新闻较真辟谣中台表现尤为亮眼。疫情期间,谣言随时出现,辟谣效率尤为关键。1月24日下午,腾讯新闻较真平台“新型冠状病毒脑炎”特别版上线,基于严格的鉴别体系和专家顾问的专业把关快速处理不同类型的网路谣言;还推出H5形态的“实时在线辟谣工具”,通过链接、长图、海报、短视频等形式,快速覆盖陌陌、微博、知乎等社交媒体平台。截至2月15日下午,“新型冠状病毒脑炎”特别版已为用户提供超过5.36亿次服务。这背后得益于较真辟谣中台的底层能力——较真中台搭建中央处理系统,利用AI等技术工具,将工业化的技术能力应用于高效的辟谣;一端接入海量的信息并对这种信息进行辨识和处理,另一端联接用户,将辟谣内容分发给用户。当前,腾讯新闻较真中台已集合谣言发觉与预警、谣言辨识与鉴别、辟谣生产与触达,以及谣言研究与科普四大能力。
图片来自网路
当然,内容与科技的融合实践主体除了限于平台型互联网机构,传统新闻媒体也在变革发展中抓住技术能力建设。纵观近年业界的媒体融合大潮,可以说内容生产分发相关技术的革新是各大媒体促使媒体融合的着力点与关键领域。例如,人民网基于自身内容错综复杂(7种少数民族语言及9种外文、60多类频道类型)的现实审视,为解决体系复杂、运营效率低、运维能力不足等疼点,建设了智能化应用平台,打造包括智能大数据服务和智能媒体应用在内的服务能力。“让数据多跑路,让人力少动手”,智能大数据服务一站式管理内容数据,智能媒体应用将技术基础与内容业务相结合上去,覆盖选题企划-新闻制做-内容初审-内容分发-传播剖析-版权追踪全链条。智能化应用平台的建设为人民网智能媒体融合提供了强悍的平台支撑,有效提升内容生产与内容营运效能。
二、未来趋势:技术对内容产业的赋能将成为未来发展的“风口”
当下,内容科技已围绕着信息采集、生产、分发、接收、反馈五个环节的智能化展开其应用,而随着5G技术商用开启的万物互联时代到来,技术对信息传播的改建向纵深处发展。高速率、高容量、低延时、低能耗的5G技术无疑是一项革命性的技术——它真正“连接一切”,将人与人、人与机器、人与世界的互联上升到生理级、心理级的互联互通,进一步拓展传播幅员、丰富传播要素、再造传播结构;它在传媒领域和传播领域的落地将会加速各类新技术对内容生产分发消费全链条的渗透,带来生产力的提高以及生产关系的解构。
1.采集:传感器拓展感官场域
万物互联环境下,智能化物体将成为信息的主要采集者。媒介是人体的延展,以传感为典型代表的信息采集工具就是人类感官的“延长”。传统新闻的信息采集主要借助记者的感官获取,但是此类方式有相当的局限性,而传感的应用能使新闻从业者更方便地获取海量且确切的数据,这除了有助于从大量复杂线索中发觉新颖的选题,还能够降低人为错误的形成。传感器一方面可以拓宽信息的来源途径,例如借助传感实时检测环境数据(包括气温、湿度等),甚至可以采集用户自发形成的生理数据(如脑电与脉搏)。另一方面,传感器还拓宽了信息的采集维度,包括时间维度与空间维度。[2]以无人机为例,5G技术将进一步赋于无人机超高清视频传输、低信噪比控制、远程联网协作和自主飞行等重要能力。
2.生产:机器生产内容海量涌现
万物互联和全时在线的数据通过数据挖掘和智能算法将生成海量的传感资讯,即MGC(机器生产内容)。所谓机器生产内容,即通过摄像头、传感器、无人机、行车记录仪等智能采集设备,结合新闻发生地附近的多维数据,自动检查新闻风波、自动生成数据新闻和富媒体资讯内容。让摄像头以及各类传感成为记者的耳朵,在突发事件和重大风波的捕捉和生成上,快人一步、自动生成。这一内容生产格局的巨大改变,势必会导致专业媒介工作者工作重心和工作逻辑的重大变革。专业传播工作者在未来传播中的主要价值角色的担当主要不是进行直接的内容生产,而是为用户生产内容(UGC)和机构生产内容(OGC)和机器生产内容(MGC)的内容生产创制模板、创新模式、开拓新的领域和新的功能、平衡社会抒发中的信息与意见失衡、建设传播领域的文化生态。[3]
3.分发:个人即时场景实现精准推送
如前文所说,传感器可以扩张从人到物的不同层面的信息采集力。万物互联状态下,人的空间位置、身体状态、运动状态甚至心理反应,在未来都可以通过传感或其他智能设备来侦测或描述微信文章自动采集软件,这为基于个人的即时场景的信息生产与推送提供了根据。目前算法技术早已才能通过搜集内容、环境以及用户等三个维度的信息来进行个性化推送,虽然对空间场景要素有所涉及,但应用还不够充分,也基本还未考虑用户实时状态、社交气氛等其他场景要素;在5G技术加持下,在深层次的人机交互基础之上基于私人场景的个性化服务将进一步提高,实现算法内容分发的“场景”增强。
4.触达:多元终端为用户提供沉浸式体验
5G的广接入下,信息接收终端将不再局限于个人联通终端(如智能手机)和家庭终端(如家庭大屏),可穿戴设备、智能家居、智能汽车等均有可能产生新的人机界面和交互方法。这些新型终端甩掉了屏幕限制,内容的接收和处理可通过多种感官体验实现,用户只需记住驱动智能设备的命令即可实现。同时,借5G 超高速的传输能力,可以解决VR/AR 在过去给受众带来的互动体验不强等问题,沉浸体验将进一步升级,人们在现实场景中能够体验到虚拟场景的沉浸感与在场感。[4]
5.反馈:数据采集将实现场景化、生理化
万物互联时代,用户反馈将愈加传感化;而传感将重新定义传播的反馈机制。一方面,用于检测内容反馈的智能工具可实现传播疗效数据采集的场景化,从延时模糊到即时精确;另一方面,对用户的洞察愈发细致全面——从浏览、评论、转载、点赞、关注等显性行为,到传感呈现的用户在信息消费过程中的生理反应。用户驱动的内容生产将会继续推进对用户需求和反馈的精准掌握。
总之微信文章自动采集软件,5G所造成的万物互联和全时在线的结果之一,就是无所不在的传感所生成的海量数据的泉涌。在未来的传播中,数据资源将成为传播驱动的最为关键性的资源和能量;实时生成的数据、实时剖析、实时调整的算法将成为整个信息系统运行的神经和命脉。掌握数据、价值挖掘、利用人工智能实用化,这恰恰就是未来职业传播工作者工作的重点与关键所在。
三、社会愿景:构建人机协同的内容科技未来生态
技术在给内容产业带来更多可能性的同时也埋伏了众多风险,如政治操控、社会歧视、隐私和产权侵害……当然,技术并非天生存恶。技术导致的危机,本质上还是人类自身的弊端缔造的;导致这种风险的重要诱因之一是技术趋于于工具理性主义,效率与利益成为最重要的标准,人文主义关爱逐渐淡化;也就是说,技术不断裹挟人类,人类的情感价值使坐落技术的工具价值,技术中心主义兴起。
人类首先要尊重人类自己,才能推动科技的人性化。必须听到在当下弱人工智能的技术现实下,人工智能及其相关技术尚处于知其然而不知其所以然、有估算而无理解的中级阶段——只能在数据层面发觉规律性模式、识别有价值的差别以及发觉数据的相关性,却未能象人类那样理解数据所蕴涵的信息语义等内涵及意义;智能化技术在内的各类新技术步入内容产业,是为了将人从一些简单、重复的劳动中解放下来,进一步提升人在其优势领域、关键领域的竞争力,旨在提高人类智能而非取代人类,人类的判定、道德和直觉对于各类智能体的关键决策不可或缺。简言之,无论内容科技带来何种程度地生产力飞越,传统的人工编辑仍饰演着“压舱石”“航向标”的角色;技术驱动的传播革命,并不是机器代替人的过程,而是“人—机”协作、共同进化的过程;人与机器之间的关系,应该更象是指挥家与乐团的关系,彼此互相协调、交互配合。
所谓人机协作,即通过技术发觉与补充人的能力局限,通过人的力量来纠正机器的怨愤与误区,这也是内容科技的价值取向。对于内容产业来说,在技术提供了高效率的前提下,我们更需要从人类生活、人性的目标来评判机器效率的意义。媒体在拥抱新技术的同时,需要做坚定的人文守望者;保持对人类生存意义和价值的关爱,以人为尺度,让技术更“正确”,更能服务于人的须要。以规则和人文精神来引导“技术向善”,或者说,推动内容科技向推动人类共同福祉的方向发展,将成为内容科技未来发展的基调。
概言之,人民网、腾讯网明天在内容科技(ConTech)上的“一小步”,其实就是整个传媒领域发展的“一大步”。让我们站在时代发展的低点上,认识和掌握内容科技(ConTech)发展的逻辑与趋势,这是决胜未来传播的一个关键。
[1]金融界.腾讯新闻ConTech合作伙伴计划 人机协同共建优质内容生态[EB/OL].
[2]喻国明,兰美娜,李玮.智能化:未来传播模式创新的核心逻辑——兼论“人工智能+媒体”的基本运作范式[J].新闻与写作,2017(03):41-45.
[3]喻国明.未来传播的三大关键变革——站在未来已来节点上的思索与展望[J].新闻与写作,2020(01):54-57.
[4]喻国明,陈雪娇,卢文婕,曹笑凡.边缘估算、5G与传播的未来融合——试论场景视阈下新闻传播过程的重新建立[J].传媒观察,2019(10):5-10.
(广告资讯) 查看全部

【天极网IT新闻频道】3月27日,人民网组织编撰的《2019,内容科技(ConTech)元年》白皮书即将发布。报告强调,媒体发展的驱动力从以内容为主转变为以内容和技术双轮驱动,技术和内容越发紧密地结合在一起,技术在媒体发展中的作用显得空前重要;并基于“顶层构架注重内容与科技的结合——全媒体建设成为急迫任务——内容科技是建设全媒体重要手段路径”的逻辑推理,得出“2019成为内容元年”的论断。这是一个重要的命题,在这一命题之下,我国互联网发展的现实怎样呢?

图片来自网路
一、现实发展:内容与科技的融合不断深入
其实,不论是概念还是实践,内容科技都不能算是一个新鲜事,技术进步对提高传播效率、效果、效益和效能的重要作用毋庸置疑——从机械化到手动与电气化再到当下的信息化,现代技术的每一次革命都带来了媒体和传播的创新与发展,媒介形态与传播能力在技术变迁中升级迭代。即使把“内容科技(ConTech)”限定为大数据和人工智能等前沿信息技术(IT)以及物联网、5G、区块链等新兴通信技术(CT),“ConTech”的理念与机制也已经出现并落地实践。
2019年5月21日,腾讯全球数字生态会议上,腾讯公司副总裁陈菊红在《内容消费的规模陷井和ConTech新世界》的主题讲演中率先提出“ConTech”的概念。她强调,人工智能等技术对内容行业的改建早已初步完成,内容+人工智能将步入专业单向对接时代。腾讯新闻的目标在于以“可理解+可学习”为核心,构建一套内容从业者与内容AI之间的标准对话体系,实现从组织到业务的深度协同,与持续进化。她将腾讯新闻为防止流量圈套、寻找优质内容最优解而探求出的人机协作机制命名为“ConTech”,展示了腾讯新闻ConTech机制的三个主要流程:1.持续运转的内容筛选漏斗;2.关键内容的数据发觉和协同生产;3.有利于优质内容供应的高效机制。

图片来自网路
概念提出的背后是腾讯对人机协同提供优质内容的不断探求尝试。仅隔半年,2019年腾讯ConTech技术会议上,腾讯新闻算法负责人刘军宁分享了腾讯ConTech的技术布局与实践,涵盖内容的生产、准入、处理、分发到体验整个链条。在内容理解方面,贯穿全流程的内容理解力,除对内容基础语义的标签分类,逐渐向内容受众面、新闻性、知识性、事件脉络、知识图谱等深层次语义建立;在内容生产方面,青云智能内容生产引擎,承担素材检索、筛稿入库、内容纠错、摘要生成、自动写作、智能配图、短视频手动生成等辅助人工的工作;在内容分发方面,打造个性化、搜索、智能语音助手为依托的下一代的智能内容分发系统。可以说,贯穿于腾讯新闻ConTech的主线思路是人机协同,人的经验、智慧赋能给机器,用机器放大人的智慧,解放生产力,释放创造力。[1]其中,青云智能内容生产引擎的智能选装图系统,每日配图数目5.5万次;智能纠错模型,每日接到101万篇文章纠错需求;智能写作系统,年写作2.4亿字,年输出稿件107万篇。
腾讯ConTech实践正借助专业智慧和算法效率的共同进化,让用户收获更高的价值密度体验。例如,这次疫情中,腾讯新闻较真辟谣中台表现尤为亮眼。疫情期间,谣言随时出现,辟谣效率尤为关键。1月24日下午,腾讯新闻较真平台“新型冠状病毒脑炎”特别版上线,基于严格的鉴别体系和专家顾问的专业把关快速处理不同类型的网路谣言;还推出H5形态的“实时在线辟谣工具”,通过链接、长图、海报、短视频等形式,快速覆盖陌陌、微博、知乎等社交媒体平台。截至2月15日下午,“新型冠状病毒脑炎”特别版已为用户提供超过5.36亿次服务。这背后得益于较真辟谣中台的底层能力——较真中台搭建中央处理系统,利用AI等技术工具,将工业化的技术能力应用于高效的辟谣;一端接入海量的信息并对这种信息进行辨识和处理,另一端联接用户,将辟谣内容分发给用户。当前,腾讯新闻较真中台已集合谣言发觉与预警、谣言辨识与鉴别、辟谣生产与触达,以及谣言研究与科普四大能力。

图片来自网路
当然,内容与科技的融合实践主体除了限于平台型互联网机构,传统新闻媒体也在变革发展中抓住技术能力建设。纵观近年业界的媒体融合大潮,可以说内容生产分发相关技术的革新是各大媒体促使媒体融合的着力点与关键领域。例如,人民网基于自身内容错综复杂(7种少数民族语言及9种外文、60多类频道类型)的现实审视,为解决体系复杂、运营效率低、运维能力不足等疼点,建设了智能化应用平台,打造包括智能大数据服务和智能媒体应用在内的服务能力。“让数据多跑路,让人力少动手”,智能大数据服务一站式管理内容数据,智能媒体应用将技术基础与内容业务相结合上去,覆盖选题企划-新闻制做-内容初审-内容分发-传播剖析-版权追踪全链条。智能化应用平台的建设为人民网智能媒体融合提供了强悍的平台支撑,有效提升内容生产与内容营运效能。
二、未来趋势:技术对内容产业的赋能将成为未来发展的“风口”
当下,内容科技已围绕着信息采集、生产、分发、接收、反馈五个环节的智能化展开其应用,而随着5G技术商用开启的万物互联时代到来,技术对信息传播的改建向纵深处发展。高速率、高容量、低延时、低能耗的5G技术无疑是一项革命性的技术——它真正“连接一切”,将人与人、人与机器、人与世界的互联上升到生理级、心理级的互联互通,进一步拓展传播幅员、丰富传播要素、再造传播结构;它在传媒领域和传播领域的落地将会加速各类新技术对内容生产分发消费全链条的渗透,带来生产力的提高以及生产关系的解构。
1.采集:传感器拓展感官场域
万物互联环境下,智能化物体将成为信息的主要采集者。媒介是人体的延展,以传感为典型代表的信息采集工具就是人类感官的“延长”。传统新闻的信息采集主要借助记者的感官获取,但是此类方式有相当的局限性,而传感的应用能使新闻从业者更方便地获取海量且确切的数据,这除了有助于从大量复杂线索中发觉新颖的选题,还能够降低人为错误的形成。传感器一方面可以拓宽信息的来源途径,例如借助传感实时检测环境数据(包括气温、湿度等),甚至可以采集用户自发形成的生理数据(如脑电与脉搏)。另一方面,传感器还拓宽了信息的采集维度,包括时间维度与空间维度。[2]以无人机为例,5G技术将进一步赋于无人机超高清视频传输、低信噪比控制、远程联网协作和自主飞行等重要能力。
2.生产:机器生产内容海量涌现
万物互联和全时在线的数据通过数据挖掘和智能算法将生成海量的传感资讯,即MGC(机器生产内容)。所谓机器生产内容,即通过摄像头、传感器、无人机、行车记录仪等智能采集设备,结合新闻发生地附近的多维数据,自动检查新闻风波、自动生成数据新闻和富媒体资讯内容。让摄像头以及各类传感成为记者的耳朵,在突发事件和重大风波的捕捉和生成上,快人一步、自动生成。这一内容生产格局的巨大改变,势必会导致专业媒介工作者工作重心和工作逻辑的重大变革。专业传播工作者在未来传播中的主要价值角色的担当主要不是进行直接的内容生产,而是为用户生产内容(UGC)和机构生产内容(OGC)和机器生产内容(MGC)的内容生产创制模板、创新模式、开拓新的领域和新的功能、平衡社会抒发中的信息与意见失衡、建设传播领域的文化生态。[3]
3.分发:个人即时场景实现精准推送
如前文所说,传感器可以扩张从人到物的不同层面的信息采集力。万物互联状态下,人的空间位置、身体状态、运动状态甚至心理反应,在未来都可以通过传感或其他智能设备来侦测或描述微信文章自动采集软件,这为基于个人的即时场景的信息生产与推送提供了根据。目前算法技术早已才能通过搜集内容、环境以及用户等三个维度的信息来进行个性化推送,虽然对空间场景要素有所涉及,但应用还不够充分,也基本还未考虑用户实时状态、社交气氛等其他场景要素;在5G技术加持下,在深层次的人机交互基础之上基于私人场景的个性化服务将进一步提高,实现算法内容分发的“场景”增强。
4.触达:多元终端为用户提供沉浸式体验
5G的广接入下,信息接收终端将不再局限于个人联通终端(如智能手机)和家庭终端(如家庭大屏),可穿戴设备、智能家居、智能汽车等均有可能产生新的人机界面和交互方法。这些新型终端甩掉了屏幕限制,内容的接收和处理可通过多种感官体验实现,用户只需记住驱动智能设备的命令即可实现。同时,借5G 超高速的传输能力,可以解决VR/AR 在过去给受众带来的互动体验不强等问题,沉浸体验将进一步升级,人们在现实场景中能够体验到虚拟场景的沉浸感与在场感。[4]
5.反馈:数据采集将实现场景化、生理化
万物互联时代,用户反馈将愈加传感化;而传感将重新定义传播的反馈机制。一方面,用于检测内容反馈的智能工具可实现传播疗效数据采集的场景化,从延时模糊到即时精确;另一方面,对用户的洞察愈发细致全面——从浏览、评论、转载、点赞、关注等显性行为,到传感呈现的用户在信息消费过程中的生理反应。用户驱动的内容生产将会继续推进对用户需求和反馈的精准掌握。
总之微信文章自动采集软件,5G所造成的万物互联和全时在线的结果之一,就是无所不在的传感所生成的海量数据的泉涌。在未来的传播中,数据资源将成为传播驱动的最为关键性的资源和能量;实时生成的数据、实时剖析、实时调整的算法将成为整个信息系统运行的神经和命脉。掌握数据、价值挖掘、利用人工智能实用化,这恰恰就是未来职业传播工作者工作的重点与关键所在。
三、社会愿景:构建人机协同的内容科技未来生态
技术在给内容产业带来更多可能性的同时也埋伏了众多风险,如政治操控、社会歧视、隐私和产权侵害……当然,技术并非天生存恶。技术导致的危机,本质上还是人类自身的弊端缔造的;导致这种风险的重要诱因之一是技术趋于于工具理性主义,效率与利益成为最重要的标准,人文主义关爱逐渐淡化;也就是说,技术不断裹挟人类,人类的情感价值使坐落技术的工具价值,技术中心主义兴起。
人类首先要尊重人类自己,才能推动科技的人性化。必须听到在当下弱人工智能的技术现实下,人工智能及其相关技术尚处于知其然而不知其所以然、有估算而无理解的中级阶段——只能在数据层面发觉规律性模式、识别有价值的差别以及发觉数据的相关性,却未能象人类那样理解数据所蕴涵的信息语义等内涵及意义;智能化技术在内的各类新技术步入内容产业,是为了将人从一些简单、重复的劳动中解放下来,进一步提升人在其优势领域、关键领域的竞争力,旨在提高人类智能而非取代人类,人类的判定、道德和直觉对于各类智能体的关键决策不可或缺。简言之,无论内容科技带来何种程度地生产力飞越,传统的人工编辑仍饰演着“压舱石”“航向标”的角色;技术驱动的传播革命,并不是机器代替人的过程,而是“人—机”协作、共同进化的过程;人与机器之间的关系,应该更象是指挥家与乐团的关系,彼此互相协调、交互配合。
所谓人机协作,即通过技术发觉与补充人的能力局限,通过人的力量来纠正机器的怨愤与误区,这也是内容科技的价值取向。对于内容产业来说,在技术提供了高效率的前提下,我们更需要从人类生活、人性的目标来评判机器效率的意义。媒体在拥抱新技术的同时,需要做坚定的人文守望者;保持对人类生存意义和价值的关爱,以人为尺度,让技术更“正确”,更能服务于人的须要。以规则和人文精神来引导“技术向善”,或者说,推动内容科技向推动人类共同福祉的方向发展,将成为内容科技未来发展的基调。
概言之,人民网、腾讯网明天在内容科技(ConTech)上的“一小步”,其实就是整个传媒领域发展的“一大步”。让我们站在时代发展的低点上,认识和掌握内容科技(ConTech)发展的逻辑与趋势,这是决胜未来传播的一个关键。
[1]金融界.腾讯新闻ConTech合作伙伴计划 人机协同共建优质内容生态[EB/OL].
[2]喻国明,兰美娜,李玮.智能化:未来传播模式创新的核心逻辑——兼论“人工智能+媒体”的基本运作范式[J].新闻与写作,2017(03):41-45.
[3]喻国明.未来传播的三大关键变革——站在未来已来节点上的思索与展望[J].新闻与写作,2020(01):54-57.
[4]喻国明,陈雪娇,卢文婕,曹笑凡.边缘估算、5G与传播的未来融合——试论场景视阈下新闻传播过程的重新建立[J].传媒观察,2019(10):5-10.
(广告资讯)