用户名:
密码:
首页
① 新闻管理
添加新闻
② 政策管理
添加政策
③ 法定规划
添加国空规划
③ 规划PDF附件
添加规划PDF附件
③ 规划图纸
添加规划图纸
④ 资料管理
添加资料
开通用户权限
⑥ AIGC课程学员
添加学员
MJ账号分组
2-AI图库管理
添加图库
3-AI新闻网站
添加信息
4-AI模型管理
添加模型
精准搜索
添加精准
知识库
添加知识库
规划问答
添加信息
小匠QQ微信群宣传
添加推荐
数据网址
添加网站
微信文章管理
课件系统
添加视频
一周热点整理
[ 常用工具 ]
格式化工具
段落合并工具
飞书
金数据
生成封面图
当前:新闻编辑 |
格式化工具
|
查看本文
标题
信息化程度很低的旅游行业如何玩转大数据?
分类
(编号:1)
国土空间
城市更新
城市设计
生态环境
乡村振兴
区域发展
专项规划
资料下载
规划头条
政策规范
规划直播
其他
新闻
好物
观点
城市
政策
设计
社区
建筑
环境
产业
旅游
交通
读书
优选
榜单
空间规划
区域
文化
村镇
智慧
会议
公众参与
微文
摩天楼
地标
航拍
规划
链接
作者
时间
2016-05-08 03:21:04
政策
省
市
年
月
直播
主办:
协办:
时间:
会议室:
直播链接:
h1
/h1
h2
/h2
strong
/strong
一段时间之前,多如牛毛的游记,大部分时候只是满足了分享者快感的文字,而没有变成数据。后来沉淀了大量游记的平台如穷游、蚂蜂窝都开始想办法把游记“结构化”,变成能够更广泛应用的数据。 在旅游行业,可能最核心的数据就是POI(兴趣点),具有极强规则的、完整的、标签极度碎片化的POI信息是这个行业里非常值钱的东西,也成为了诸如TripAdvisor(猫途鹰)的核心竞争力。猫途鹰的POI信息几乎是不可能对外大规模释放的,第三方无论是购买、还是数据交换,都很难拿到完整的TripAdvisor的POI数据。TripAdvisor开放的API接口,只能够为第三方提供所有POI的评论信息。 境内在线旅游行业,持有境外POI信息主要有三拨(如有遗漏欢迎补充,大众点评之类暂不考虑): 擅长以抓取方式收集并整理信息的一些创业公司,如口碑旅行、梦想旅行,妙计旅行; 基于UGC内容整理的POI信息:主要就是穷游; 自采POI信息的创业公司:游谱旅行、四万公里。 之前我们和穷游负责大数据的VP张棋就这件事聊了聊,张棋坦言这是一个庞大的工程,迄今为止穷游覆盖了300多个国家和地区,7000多个城市和区域,包括了景点、美食等POI的数量已经达到了百万量级。而随着目的地信息的变化,这些POI必须持续更新,除了基础信息之外,评论也在随之更新。 张棋介绍,最初做POI的方式是通过“网友贡献+编辑审核”的方式,以比较粗的维度划分国家、地区、城市,然后尽量保证各个维度下面都有相应的POI信息做到“该有的地方都有”。而第二期的做法是“掘金”,一直持续到现在,通过“运营编辑+算法支持”的方式:编辑给大致的框架,例如什么算是优秀内容,以人工做范例(在长游记中找到几张图和一段话),然后技术团队通过数据建模和算法,用文本挖掘的手段覆盖所有内容,把结果填充到POI和目的地的架构中。 在整个穷游收集POI的过程中,除了根据论坛的内容做筛选和挖掘以及用户主动提交之外,也有一些外部数据源做实时不断的更新,例如大巴车的时刻表。这一点上,妙计也用的相应的方式,从而保证动态的行程规划是可行的——如果行程助手让你去搭乘巴士,而巴士停运了会怎么样? 在这里张棋分享了一些穷游的做法,工作节奏上他们会每一段时间重点攻克一个主题,先是酒店,然后是餐厅。在文本挖掘上,穷游除了抓取文字之外还会抓取相应的图片,张棋坦言这里没有通用且完美的解决方案,只能不断的通过运营编辑反馈机器的抓取结果,不断提高覆盖度,争取少漏掉一些重点信息。 通过不断的外部数据源更新、用户提交和内部挖掘,穷游的POI信息维度已经超过了100个,主要可以分为两类,一类是属性维度,以清迈女子监狱按摩店为例,包括了中文名、当地原名称、英文名、地址、经纬度坐标、平均价位等;另一类是标签属性,也可以理解为“属于哪一类”,休闲、刺激、适合什么人群、亲子或单身等等。 在保证POI覆盖度之后,POI的另外一个要点是标签体系:一个POI都需要标签?标签需要多细化的颗粒度?这都是需要考虑的问题。一套成熟的标签体系能够极大的提高用户筛选的效率,自然也会提高转化率。 以酒店为例,穷游的运营编辑会提供诸如“交通”、“设施”、“餐饮”、“服务”、“干净卫生”、“汉语”等维度,然后机器根据这些语义做抽象出相关内容,做主题挖掘。当用户评论或游记中有描述命中了这个主题,机器就会放进“池子”做第一轮的筛选。在这个“初选”的池子中,机器会为每个话术赋值,然后根据权重得出最终结果。当然,餐厅就会有不同的维度,景点也有不同。 POI的价值毋庸置疑,如上面所说,妙计和穷游都在多个维度丰富自己的POI信息,尤其是动态更新的信息,以保证智能生成的行程规划是切实可行的。张棋说,行程助手就是POI信息的串联,一天可能就涉及50-70个POI。如果不能够保证丰富度和准确度,整个行程助手是缺乏价值的。 而进一步挖掘,在商业化的路上POI是重要的连接机制(我们之前在讨论游谱旅行的时候也说过)。与游谱旅行的创始人李小坚相似,张棋也认为,内容向商品的转化需要POI作为载体——当用户浏览景点信息的时候,如果有对应商品,直接就可以完成预定。“这也是穷游预定转化上很重要也很成功的尝试。”张棋说。 此外,在目的地的智能推荐上,如果没有准确实时的POI信息,推荐就可能是“不靠谱的”,例如清迈有“周六夜市”和“周日夜市”,仅在当天开放,而如果推荐周一前往,就太不智能了。 在POI的基础之上,很多玩家都在尝试智能推荐,这也是旅游进入移动端时代的一大想象空间——基于用户所在的地理位置和用户画像,随时做智能推荐,从而大幅提高转化率。之前有一些创业公司讲过相似的故事,但迄今还没有人实现。 没实现的原因也不难理解,没有很大的用户基数,用户画像的准确度就会打折扣,自然也会影响推荐的准确性;另一端,如果没有优质的POI数据库,推荐的都是老套路,用户也不会喜欢。大平台如阿里旅行,可以基于用户在阿里其他平台(淘宝、天猫)的购买行为做智能推荐,也还没有到达行中、实时的级别。 事实上,在一些数据交易平台或数据抓取公司那里,用户画像是可以获得的,但我个人了解到,用户画像的准确程度,以及关于这个用户的信息维度,其实并不完全适合旅游行业——大部分关于用户的画像集中在其日常购买、金融理财等层面,通过这些层面的数据推导至旅游行业,准确性自然会降低。 作为拥有数千万出境游注册用户的穷游,从2011年开始积累用户的访问和点击行为,打算为日后的智能推荐和精准营销做准备。张棋介绍,穷游会格外关注“平时生活在哪里、关注的旅行信息是什么、潜在目的地是什么、处于旅行周期的什么阶段”等信息。之后穷游把用户分为:行前观望、行前准备(多次看多次买,可能推翻之前的选择)、即将出发(开始购买轻量级的商品例如WIFI或目的地商品如CityWalk)、行中、回来等阶段,匹配相应的产品。张棋说,穷游目前格外关注出发前一两天的用户,通过其酒店预订行为,重点推送相应的轻量级商品。 张棋坦言,精准的智能推荐可能会让转化率呈10倍的改善,而最大的挑战在于,必须将用户画像和POI信息都实现高颗粒度,才能做准确的匹配——这里的前提是有这些数据。 我们了解到,包括阿里旅行在内的在线旅游玩家都在寻求高品质的POI和用户画像数据。这可能不是一家企业的核心竞争力(在数据上的应用层面才是),但应该能构筑起一些壁垒。当各家都在构建自己的POI数据库的时候,重复劳动是不可避免的,这里也许有合作共赢的空间。 更值得关注的是,谁能依托自己的实力(这可能是用户基数、可能是分销实力、可能是对旅游行业的理解,行业里可能还没有定论)为POI数据制定发布规则,反而可能去争夺制高点。 来源:36氪