购物意图分析

最近在读《淘宝技术这十年》一书,发觉里面常有一些很有意思的分享与概念,例如下面的这个,购物意图分析:

通常我们在逛淘宝时会使用到搜索功能,但你可能不知道你输入不同的搜索词,便体现了你的不同购物意图,搜索引擎便会根据你的意图来呈现不同的内容,让推荐更加精准,直达你内心的需求,主要有如下几种意图:

1、浏览型:没有明确想买的东西,边看边买,这样的用户例如会输入“2017年十大香水排行”,“今年最流行的毛衣”,“zippo有多少种类”。使用的形容词而不是商品属性

2、查询型:有一定的购物意图,体现在对属性的要求上,例如:“适合老人用的手机”,“500元 手表”,其中“老人用的” ,“500元”这些词一般是作为商品的属性的

3、对比型:已经知道自己要买的是什么东西了,只是不知选择哪个产品或型号,这时通常会这样搜索,“iphone4 4s”等,搜索词中会出现同样商品的不同型与或品牌

4、确定型:直接输入产品与型号来搜索的了,例如“iphone4s”

用户的一言一行都体现了他的意图所在,要让机器像人脑一样能理解到GET到别人意图是非常难的,但也不是无规律可循,像上面总结出来的关键词特点与组合方式,电脑就可以根据这样的规律来发现我们的意图是什么。我们人脑是不需要找规律就能理解到别人的意图的,根据经验或理解力,但电脑可没有这样的东西,它的判断必须是有证有据的,客观的,特征的。

时间: 03-20

购物意图分析的相关文章

R语言和数据分析十大:购物篮分析

提到数据挖掘,我们的第一个反应是之前的啤酒和尿布的故事听说过,这个故事是一个典型的数据挖掘关联规则.篮分析的传统线性回归之间的主要差别的差别,对于离散数据的相关性分析: 常见的关联规则: 关联规则:牛奶=>卵子[支撑=2%,置信度=60%] 支持度:分析中的所有事务的2%同一时候购买了牛奶和鸡蛋,需设定域值,来限定规则的产生. 置信度:购买了牛奶的筒子有60%也购买了鸡蛋,需设定域值,来限定规则的产生. 最小支持度阈值和最小置信度阈值:由挖掘者或领域专家设定. 与关联分析相关的专业术语包含: 项

Query意图分析:记一次完整的机器学习过程(scikit learn library学习笔记)

所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质. 学习任务(一个二分类问题): 区分一个普通的互联网检索Query是否具有某个垂直领域的意图.假设现在有一个O2O领域的垂直搜索引擎,专门为用户提供团购.优惠券的检索:同时存在一个通用的搜索引擎,比如百度,通用搜索引擎希望能够识别出一个Query是否具有O2O检索意图,如果有则调用O2O垂直搜索引擎,获取结果作为通用搜索引擎的结果补充. 我们的目的是学习出一个分类器(classifier),分类器可以理解为一个函数,

数据挖掘算法之-关联规则挖掘(Association Rule)(购物篮分析)

在各种数据挖掘算法中,关联规则挖掘算是比较重要的一种,尤其是受购物篮分析的影响,关联规则被应用到很多实际业务中,本文对关联规则挖掘做一个小的总结. 首先,和聚类算法一样,关联规则挖掘属于无监督学习方法,它描述的是在一个事物中物品间同时出现的规律的知识模式,现实生活中,比如超市购物时,顾客购买记录常常隐含着很多关联规则,比如购买圆珠笔的顾客中有65%也购买了笔记本,利用这些规则,商场人员可以很好的规划商品摆放问题: 为叙述方便,设R= { I1,I2 ......Im} 是一组物品集,W 是一组事

使用excel进行数据挖掘(8)---- 购物篮分析

在配置环境后,可以使用excel进行数据挖掘. 环境配置问题可参阅: http://blog.csdn.net/xinxing__8185/article/details/46445435 样例 DMAddins_SampleData.xlsx 文件下载地址:http://download.csdn.net/detail/xinxing__8185/8780481 在数据表中,选择table analysis tools sample表,该表中是用户的信息统计,包括婚姻状况,性别,收入,子女,教

R语言与数据分析之十:购物篮分析

提到数据挖掘,我们第一反应就是之前听到的啤酒和尿不湿的故事,该故事就是典型的数据挖掘中的关联规则.购物篮分析区别于传统的线性回归的主要区别为,关联分析针对离散数据: 常见关联规则: 关联规则:牛奶=>鸡蛋[支持度=2%,置信度=60%] 支持度:分析中的全部事务的2%同时购买了牛奶和鸡蛋,需设定域值,来限定规则的产生: 置信度:购买了牛奶的筒子有60%也购买了鸡蛋,需设定域值,来限定规则的产生: 最小支持度阈值和最小置信度阈值:由挖掘者或领域专家设定. 与关联分析相关的专业术语包括: 项集:项(

Python中的Apriori关联算法-市场购物篮分析

数据科学Apriori算法是一种数据挖掘技术,用于挖掘频繁项集和相关的关联规则.本模块重点介绍什么是关联规则挖掘和Apriori算法,以及Apriori算法的用法.此外,在小型企业场景中,我们将借助Python编程语言构建一个Apriori模型. 什么是关联规则挖掘? 如前所述,Apriori算法用于关联规则挖掘.现在,什么是关联规则挖掘?关联规则挖掘是一种用于识别一组项目之间的频繁模式和关联的技术. 例如,了解客户的购买习惯.通过查找顾客放置在其“购物篮”中的不同商品之间的关联和关联,可以得出

关联分析(购物篮子分析market basket analysis)R练习

关联分析(association analysis)又称关联挖掘,就是在交易数据.关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式.简言之,关联分析是发现数据库中不同项之间的联系. 与回归问题.分类问题不同,关联算法不能进行预测,但可以用于无监督的知识发现,寻找数据之间的关联性.由于其本身不需要提前标记数据,算法实施也很便捷,但是关联算法除了从定性的角度衡量其有效性以外,尚无一个简单的方法来客观地衡量其性能. 基本概念: 1.A→B的支持度:事件A,B同时发生的概率suppo

技术普及帖:你刚才在淘宝上买了一件东西

你发现快要过年了,于是想给你的女朋友买一件毛衣,你打开了www.taobao.com.这时你的浏览器首先查询DNS服务器,将www.taobao.com转换成ip地址.不过首先你会发现,你在不同的地区或者不同的网络(电信.联通.移动)的情况下,转换后的IP地址很可能是 不一样的,这首先涉及到负载均衡的第一步,通过DNS解析域名时将你的访问分配到不同的入口,同时尽可能保证你所访问的入口是所有入口中可能较快的一个 (这和后文的CDN不一样). 你通过这个入口成功的访问了www.taobao.com的

浏览淘宝网页背后所发生的事情

DNS服务器 - 转换成IP地址 负载均衡的第一步:通过DNS解析域名时,将你的访问分配到不同的入口,同时尽可能保证你所访问的入口是所有入口中可能较快的一个. 成功访问实际的入口IP地址,这时产生了一个PV(Page View,页面访问量) 生成淘宝首页页面的服务器可能有成百上千台.你的一次访问会被分配给其中的一台服务器完成.这个过程要保证公正.公平.平均.其中最关键的便是LVS(Linux Virtual Server,世界上最流行的负载均衡系统之一.) 浏览器并发加载的资源数量是有限的.淘宝