• 数据分析
    创业公司如何构建数据指标体系? 对于从 BAT 等互联网公司出来的,已经经历了数据分析的历练,会有一个做事情看数据的习惯。而对于毕业之后就创业,或者是产品经理或运营专员新手,一般会对构建指标体系比较困惑,不知如何下手。甚至有些在微信公众号后台或者百度统计后台看到的几个指标,就觉得算是有了数据指标体系了,但又会发现与许多实际的工作脱节。我这里给大家介绍两套构建指标体系的方法,第一关键指标法和海盗指标法。 第一关键指标法 现在我问你一个问题,对你所负责的产品来说,最关键的一个指标是什么?我尝试问过一些人,特别是同一个公司的几个人,你会发现他们冒出来的第一关键指标是不同的。当然,这还不是最惨的,更惨的是根本就找不出来关键指标。对于一个大公司来说,比如像百度,因为产品很复杂,有很多的产品,即使同一个产品,也有不同的职能部门,他们会有不同的关键指标或者 KPI,情有可原。但对于一个创业公司,尤其是刚成立的初创公司,几十个人的团队都不是围绕同一个目标努力的,那问题就比较严重了。 第一关键指标法是在《精益数据分析》(Lean Analytics)一书中提到的方法,这个方法不是说一个公司用于只为一个指标负责,而是说在任意一个时间点,肯定只有一个最关键的指标。随着业务的发展,你的关注重点会有变化。我对第一关键指标的方法又做了一个延伸,关键指标又可以衍生出许多其他的指标。比如对于一个成熟的电商产品,它最关心的可能是销售额。但销售额我们又可以衍生出访问量、转化率、客单价等指标,我们通过优化这些衍生指标,来实现关键指标的增长。对公司来说,基于关键指标制定目标。 这样做的好处有两点:一是确定了现阶段的最重要的问题,二是可以基于关键指标的当前的状态,制定清晰的目标。否则你可能问题没找对,努力达到的数字也是没有意义的。 对于一个创业公司,不同的阶段需要关注的重点是不同的。我把创业公司分成三个阶段: 1、MVP 阶段: MVP(Minimium Viable Product,最小可用产品) 是《精益创业》(Lean Startups)一书中提出的理念,在创业的最早期,你的关注点是确定用户需求,并做出一个最小可用的产品来验证需求的真实性。大量失败的创业最后发现解决的是个伪需求,为一个不存在的需求做出了一个不需要的产品。更好的方式是用最小的代价满足需求,然后再想更高效的方法去优化它。在这一阶段,数据分析的价值比较小,你需要的是定性分析,通过用户访谈,直接确定产品的满足情况,并不需要在数据分析方面投入大量工作。 2、增长阶段: 这个时候你的产品已经出来了,并且有用户在用,是时候需要做数据分析了。这一阶段我又把它分为有重叠的两个阶段:留存阶段和引荐阶段。我们在推广产品之前,一定要确认我们的产品确实是能够给客户带来价值的,并且有比较好的体验。那怎么确认这一点呢?除了直接听用户反馈之外,最重要的就是看用户的活跃度了。这里我们就需要做留存分析,比如看次日留存,如果发现你的用户次日留存率非常低,那说明根本吸引不住用户,还是要先优化产品。 等产品优化做的差不多了,我们就要进入引荐阶段了。一个好的产品会说话,最直接的就是口碑力量。对有些产品来说,它天然的带有病毒性质。比如,PayPal 的一个用户向朋友转钱,那么就会促使朋友也注册 PayPal。你可以通过人工的方式促进这一传播速度,比如 PayPal 每引荐一位朋友注册,可以得到 10 美元的奖励。这里需要关注的是 病毒系数 和 病毒周期,如果一个用户会推荐两个用户成功注册,那么这个病毒系数就是 2,如果这是经过 1 年才做到的,那么病毒周期就是 0.5 年了。 当然,并不是每个产品都能找到病毒传播的途径,找不到也没关系,我们还可以通过口碑。就拿我们来说,我比较关心的是 NPS(Net Prompter Score,净推荐值)。假设我们有 100 个客户,这 100 个客户中,有多少是给我们推荐了新客户的,有多少只是自己用的,有多少是通过私下或公开途径对我们进行负面评论的。拿推荐我们的减去否定我们的,就是 NPS。一个好的产品,NPS 应该在 50 以上。比如微信,说微信不好的很少,如果你的朋友没有在用,你会直接推荐他用,所以 NPS 会非常高。在 2006 年的时候,360 安全卫士刚出来,我真的觉得很好,以至于只要有亲朋好友的电脑有垃圾插件,我就推荐他们装一个,当然,我现在已经很久没推荐它了。 3、营收阶段: 这个阶段产品已经相对比较成熟,我们考虑的重点就变成了如何赚更多的钱,以及如何规模化。我们关注的重点成了 LTV(Life Time Value)、CAC(Customer Acquisition Cost)、渠道分成比例、渠道用户盈利周期、成本等。一般到这个阶段,创业公司就不再那么有趣了,最大的乐趣可能是获得量级上的增长。这个时候公司就需要寻找一些新的方向,为下一步增长做准备,而新的方向,又可以重复这三个阶段。 当然,我这里只是列举了不同阶段的典型关键指标,对于你的项目本身,还是要具体来看。比如,对于百度知道这个产品,因为属于百度搜索的子产品,它本身并不需要太关注盈利的问题,所以现在依旧还处于增长阶段,只是产品已经比较成熟了。接下来我分享一下我在加入百度知道后,寻找第一关键指标的经历。 2007 年我毕业后加入百度知道做后端研发。作为 RD,我每天也收到一系列报表邮件,这些报表里面有很多统计的一些数据。比如,百度知道的访问量、检索量、IP 数、Session 数、提问量、回答量,设置追加答案的数量,这一系列指标。当时,看的其实感觉很模糊。 我在思考:这么多的指标,不能说这也提高,那也提高吧?每个阶段肯定要思考哪个事最关键的,重点要提高哪些指标。开始的时候其实是没有任何区分的,不知道什么是重要、什么是不重要。 后来,慢慢有一些感触和认识,就发现其实对于访问量、检索量这些指标并没那么重要。因为百度知道大部分流量都是来自于大搜索,把它的展现做一下调整或者引导,对量的影响非常大。虽然,跟百度知道本身做的好坏也有直接关系,但是它很受渠道的影响——大搜索这个渠道的影响。 提问量我认为是非常重要,提升提问量,那么整个百度知道平台的问题就多了。提升回答量,让这些问题得到回答,高质量的内容就非常多了。提问和回答都很重要,都要发力,这让我很困惑。 有一次产品会,我就问当时的产品负责人是孙云丰,可能在百度呆过的或者说对百度产品体系有了解的都会知道这么一个人,非常厉害的一个产品经理。我当时就问了他这个问题,我对提问量、回答量都要提升这个困惑。 他就说了一点,其实提问量不是一个关键的问题,为什么?我们可以通过大搜索去引导,如果一个用户在大搜索里面进行搜索,发现这个搜索没有一个好的答案,那就可以引导他进行一个提问,这样其实这个提问量就可以迅速提升上去。 我一听一下就解决了这个困惑,最关键的就是一个回答量,我所做的事情其实怎么去提升回答量就可以了。 这里面把百度知道这个产品抽象成了最关键的一个指标——那就是如何提升回答量,在这个问题上当时做了一个事情就是进行问题推荐,根据用户的历史回答记录,或者是检索或浏览过的页面记录,给用户推荐感兴趣的问题,整个项目做下来提升了 7.5% 的回答量,是我非常有成就感的一个项目。 海盗指标法 2007 年,500 Startups 创业孵化器的创始合伙人 Dave McClure 针对创业公司应该关注哪些指标,提出了一套模型—— Pirate Metrics,即海盗指标法。他将创业公司需要关注的指标归结为五个方面:Acquisition(获取)、Activation(激活)、Retention(留存)、Revenue(营收)、Referral(引荐),简称 AARRR!。这一抽象经典的以至于过了 9 年了,都一点还不过时。Dave McClure 曾经是 PayPal 早期的营销总监,算是 PayPal 黑帮的代表人物之一,后来又是 500 Startups 的创始合伙人,有过成功的打造产品的经历,又指导过众多创业团队,能总结出这么牛逼的方法,也算是情理之中。网上的许多材料都是把这五个方面画成一个漏斗形状,以至于一些人理解这几块是顺序进行的,这是错误的。我也看了他在今年接受的一个采访,专门强调了这个误区。这一方法相比第一关键指标法,阶段划分更加清晰,但因为 Dave McClure 是营销出身,所以侧重点都在如何做营销方面。 我把这五点分为三个方面: 1、拉新: 首先是触达用户(Acquisition),让用户知道你,然后才可能选择你。之后是激活(Activation),一个用户到达你的首页,并不标明他就是你一个真正用户了,他可能成功注册,或者访问超过 10 个页面,才定义为激活。然后是引荐(Referral),一个好的产品,应该是自传播的,通过口碑,有越来越多的人使用。或者是通过一些激励措施,让老用户拉新用户。许多 Growth Hacking 的案例,都是在强调如何发挥引荐的威力。 2、留存: 在做好留存之前,最好不要花太多的功夫拉新。如果你的产品不能解决用户的问题,或者用户体验不好,那么拉的人越多,流失的越多,就像猴子掰玉米。留存就是要提升核心用户的重复频率,比如电商产品的复购,比如考察用户的次日留存率。 3、营收: 创业公司的最终目的都是为了赚钱,不是为了做慈善。就像百度如果不做竞价排名,也不可能有今天。如果一个产品有大量的用户但赚不了钱,那是很难持久的。比如我从 2011 年就开始用 Evernote,它是一个非常好的产品,但它即使天天推荐我升级为付费用户,我依旧没有动力。去年 Evernote 被唱衰的比较多,被认为是一个要倒掉的独角兽,CEO 都辞职了。烧钱可能能持续一段,但最终要实现正的增长。我介绍过他们如何像高交易量卖家收费的转型故事,非常成功。 下面这张图,描述了这五个环节的相关工作,我这里就不详细展开了。 而这里的每个环节,都会有一些需要衡量的指标。 表格里的指标都是和网站访问相关的,只是用于做参考,对于你的特有业务,还是需要具体问题具体分析。 本文作者桑文锋,神策数据创始人 & CEO,前百度大数据部技术经理。 来源:36氪
    数据分析
    2016年06月30日
  • 数据分析
    GrowingIO获得2000万美元A轮融资,在无埋点的基础上强化实用场景 今日,GrowingIO在北京召开发布会宣布,已经获得 2000 万美元 A 轮融资,投资方是经纬中国、NEA、Greylock。此前在 2015年8月,其获得过经纬中国、Greylock、NEA 的 220 万美元天使轮融资。 GrowingIO 成立于 2015年5月,创始人张溪梦是原 Linkedin 商业分析部高级总监,曾被美国 Data Science Central 评选为 “世界前十位前沿数据科学家” 。他创办 GrowingIO 的目标是为互联网企业提供方便高效的数据分析服务,从而令企业做到数据驱动,提高商业运营效率。 GrowingIO 从数据采集技术切入,最大的亮点是不需要开发人员埋点,就可以详细地收集用户的数据。得到数据之后,GrowingIO 的分析师会根据数据,帮助客户梳理业务上的问题,提出可能适用的数据分析模型。当客户的运营、销售或者数据科学家熟悉 GrowingIO 系统之后,便可以根据 GrowingIO 采集的原子级别的数据,挖掘出更多的数据分析应用场景,比如提升用户转化率、减低客户流失率和深刻理解客户分群等。 此外,GrowingIO 还发布了 V2.0 版本,在无埋点技术和全量实时的数据分析功能的基础上,GrowingIO 全新上线了更精细的漏斗对比、用户细查、热力图等实用功能。 此前国内虽然有 GA、百度统计、友盟等数据分析工具,但是这些工具更偏重于页面访问量、活跃用户量、新增注册用户、交易数量以及支付成功率等基础指标,但无法支持更精细的数据分析,想要了解每一个用户在哪一个环节流失、用户的转化效果、用户属性等都需要埋点才能实现,而埋点不仅操作麻烦,还有漏埋和错埋的风险。 张溪梦强调,GrowingIO 新版产品能够呈现用户行为的每一次点击、每一次跳转、每一次登录等全量、实时用户行为数据,并在此基础上,可通过用户分群、漏斗对比等功能,分析不同访问来源、不同城市、不同广告来源等多维度的不同转化细节。 产品经理、市场运营人员不再只看到表面整体转化率,还能看到了解转化过程中每一处细节,帮助其在第一时间找到转化突破点和优化点,以此改进产品体验、调整运营策略。 据悉,GrowingIO 已有 1000 多家客户,其中包括点融、人人贷、普惠金融、唯品会-乐峰、北森、销售易、环信、明道、猎上、名片全能王、回家吃饭、下厨房、Camera360 等近百家付费客户,涵盖互联网金融、O2O、电商、SaaS 等网站和 APP 客户。 发布会上,经纬中国创始管理合伙人邵亦波也到场,他表示,“用户行为数据驱动运营,将成为互联网领域的水电煤,价值巨大。在硅谷,这已是 LinkedIn、Facebook 等业内巨头的标配。同时美国同类型创业公司 Mixpanel、Optimizely 等企业也很快成为 10 亿美元量级公司。而在国内,随着互联网红利逐步衰减,精细化运营也成为互联网行业关注的重点。 ”   原创文章,作者:徐宁,如若转载,请注明出处:http://36kr.com/p/5048713.html 
    数据分析
    2016年06月28日
  • 数据分析
    数据分析平台ASO114获200万元种子轮融资 App推广数据分析平台ASO114获200万元种子轮融资,投资方为个人。 ASO114是一家App推广数据分析平台。致力于为用户提供免费分析工具,帮助客户自动化处理繁杂的数据。 ASO114的核心内容就是ASO优化,通过24小时不间断追踪超过400万款应用最新数据动态,为开发者提供最准确和权威的ASO数据分析服务,提升其App曝光度,降低推广成本,最终获得更多精准用户。ASO114向用户提供榜单实时排名、完整的实时热搜词和关键词搜索指数排行、竞品对比数据、用户评论走势等,对App进行更具体完整的ASO数据分析,同时分别提供一键式优化助手和定制化的ASO专家服务,帮助创业者进行专业的ASO优化。 ASO114的盈利模式很清晰,一是平台服务费;二是深度分析报告付费可看,比较竞品分析报告这一类;三是提供定制化服务,和企业合作全权受委托做优化服务;最后是定期举办的线下深度沙龙培训的学费,面向愿意学习相关基础技术的人群。当前正通过全国性的落地沙龙扩大知名度和影响力。 团队现在有25个人,技术板块12人,但他们的理念是全员销售,因为他们认为技术和商务理念完全隔离打磨不出好产品,也不利于对外传播。团队的联合创始人共有4位,品牌营销和技术人员都有。这个项目的发起人其实就是搜索技术行业出身,有多年技术经验,他认为SEO红利已过,所以转向ASO寻求全新的机遇。   来源:思达派
    数据分析
    2016年06月28日
  • 数据分析
    Oracle以5.32亿美元收购节能数据分析公司Opower  据华尔街日报报道,软件巨头 Oracle 已同意以每股 10.3 美元共 5.32 亿美元(较早前路透社的消息是 5.48 亿美元)的价格现金收购利用数据分析帮助用户节能的云服务提供商 Opower,与上周 5 收盘价相比,这个价格溢价了 30%。   Opower 是一家创办于 2007年 的能源数据分析公司,其目标是帮助家庭用户实现节能。Opower 可以在不需用户安装任何智能设备的情况下,便可得知家庭中制冷、制热设备每天消耗了多少电能(从电力公司拿到的数据)。同时 Opower 还可以让用户看到邻居们的用电账单进行比对,从而在比较重促进节能行为。通过这些举措,Opower 帮助用户实现了平均 1.5%-3.5%的节能效果,同时由于用户可以实时了解用电情况,从而避免了不必要的浪费。2014年Opower 已经实现了上市。目前 Opower 的云服务拥有 6000 万用户,分析的电表读数超过了 6000 亿次。   Oracle 本身此前已经涉足电力领域的业务,OracleUtilities 就是针对公用事业的云解决方案,可以为客户提供基于云的各种管理和分析功能。在收购了 Opower 之后,Oracle 在公用事业领域 SaaS 将少了一个强劲的竞争对手。   这是 Oracle 在 2 周内进行的第 2 项收购—上周的 4月28日,软件巨头刚刚以 6.63 亿美元收购了建筑工程云服务提供商 Textura。接连的举动表明 Oracle 有意进一步拓展垂直领域的云服务。同时这也表明,在 IaaS 与 PaaS 被 Amazon、Google、微软、IBM 等公司占据了大部分市场份额的情况下,Oracle 正视图通过收购垂直市场的云服务提供商来扩大在 SaaS 市场的影响力。   来源:36氪,作者:boxi,如若转载,请注明出处:http://36kr.com/p/5046576.html
    数据分析
    2016年05月03日
  • 数据分析
    搜索难用、个性推荐不准?达观数据以此切入大数据服务 几乎每见一个创业者,我都会听到一次 “…,然后我们用大数据做用户精准画像 / 智能推荐 / 金融征信…”,其中有多少人举着大数据的旗、干着基础数理统计的事,大家心知肚明。 大数据背后的技术算法是核心,创业公司搭一个基础大数据的 “台子” 至少要请 4 个工程师,即使程序员的月薪降到 12k,也意味着每年至少 50 万元的成本。在创业初期,产品、商业模式都需要不断打磨、改善的情况下,分出精力和财力去做这件事,不一定划算。 所以这种服务交由第三方企业来做是趋势,但由于价格高、服务不容易产品化、标准化,导致不容易区分服务的水平。另外,一家第三方服务商在不同应用场景上也有不同的表现,做得好坏主要还是看应用场景以及是否能结合客户业务来提升其业绩。 最近刚刚拿到来自真格基金、众米资本和掌门科技集团1000 万元天使投资的 “达观数据科技(官网)”,主要的应用有三:数据挖掘分析、搜索性能优化、通过用户画像做精准推荐。同样以智能推荐为核心,较为成熟的国外公司是Taboola。 在数据采集方面,大数据公司通常会用爬虫抓取网络信息,并打通第三方应用 SDK、Java Script 接口来获取一些浅层数据,比如日活、月活、用户留存率等等。而除此之外,达观还要求其客户向其打通更深层的 js 数据,比如用户点击行为、收藏记录、付费记录等等。 在此之后达观为客户提供最基础的服务是数据分析,比如用户在应用搜索栏和个性推荐栏中的转化率分别是多少。该公司也推出了一个免费的 APP “达观公众号”,为微信公众号运营人员提供数据分析工具,希望以此积累数据和用户口碑。 而达观核心的应用场景则是搜索优化和智能推荐,前者如关键字补全、自动纠错、相关搜索、中英文自动串联识别,这些体验我们能在 Google、百度等搜索引擎中感知到,中小企业很难做好却又非常需要,这就是为何知乎要引入搜狗来提供搜素技术(知乎的搜索体验一直饱受诟病)。 智能推荐的应用也不难理解,早期以 Amazon 为典型的商品推荐算法用户早已司空见惯,比如用户在某电商买了辆自行车,随即便推荐坐垫、头盔等相关产品,常见的算法原理有 “与你类似的人喜欢什么” 以及 “从你喜欢的东西推测出你还会喜欢什么”。许多创业公司都是通过为产品打 tag 的方式强行关联相似产品,体验不一定好。 达观在引擎架构研发中使用到了点击模型,通过与用户的隐性交互如点击反馈,可以对结果进行调优:将符合用户偏好但位置靠后的 item 提取至前,或者将不符合用户意图的 item 降权减分。 以电商推荐系统为例,这里引用该公司技术人员江永青在其微信公号发布文章中的论述: 协同过滤算法中,如果没有显性的评分机制,就需要收集点击的行为来作为正向的评分。不同类型的点击(如查看、加购物车、加关注等)可以生成不同维度的二维相似度矩阵,最后推荐的结果由这些矩阵计算生成的中间结果加权得到。 不过江永青也表示点击模型存在一些挑战和难点,包括位置偏向、冷启动数据不足、感知相关性与数据无关、无法覆盖长尾点击数据、故意点击作弊、Session 手机难。 大数据服务的量化标准是为客户带来多少业绩提升,达观数据 COO 冯佳妮向 36 氪列举了一些案例,其中比较突出的是文学网站 “潇湘书院”,该公司根据用户浏览、点击、购买等记录做出一套新的推荐系统,较之前提升了 300%的下单购买率、85%的点击率,年费大概为几十万元。 达观数据自 2015年5月 创建、10月 上线达观公众号产品,至今已累计服务 8000 个自媒体用户。 而其面向大 B 客户的服务则按照 SaaS 的形式收取年费,每笔从 20 万元至 200 万元不等。冯佳妮表示,已经在和一些电商企业洽谈数据打通事宜,比如某国内女性经期管理应用、同仁堂旗下的保健品电商品台,还有一家 FA 机构。该公司也将于今年上半年和复旦大学计算机学院合作组建 “大数据实验室”,与科研机构联合做政企服务,相关政府单位已经提出文化场所选址规划、管辖范围内企业运营情况分析等需求。 做企业深度服务的订单周期较慢是正常现象,但达观面临的主要问题还是如何获得更多客户,不得不解决的问题有两个: 需要提供统一接口,满足普通企业的基础需求,客户提出个性化需求后只需做简单的改动而不用重头再来。冯佳妮表示未来希望做成类似云服务的产品,让客户按需选择服务。 目前达观团队有 20 余名,因人手不够的问题只好将一些找上门来的客户暂时搁置,即使该团队有不少技术大牛,但人才稀缺是不得不考虑的问题。 达观数据成立时间只有 7 个月,核心的三位联合创始人全部出自盛大: CEO 陈运文为复旦大学计算机博士,曾担任盛大文学首席数据官,腾讯文学高级总监、数据中心负责人,百度核心技术研发工程师,国际计算机学会(ACM)会员,中国计算机学会(CCF)高级会员,在国际顶级学术期刊和会议上发表多篇 SCI 论文,多次参加 ACM 国际数据挖掘竞赛并获得冠军荣誉; CTO 纪达麒为原腾讯文学数据中心高级研究员、盛大文学技术总监等职务;  原搜狗广告技术部和百度技术部高级工程师;拥有北京邮电大学计算机硕士学位; COO 冯佳妮为原盛大云计算公司运营总监、安普丹华国际咨询公司高级咨询师,多次获安普丹华公司 Top-Sales 荣 誉;拥有山西财经大学工商管理和商务英语双学士学位。 注:该团队正在招募各类人才,有意者可联系 Hr@datagrand.com    原创文章,作者:暮雨,如若转载,请注明出处:http://36kr.com/p/5042353.html
    数据分析
    2016年01月19日
  • 数据分析
    在公开信息中寻找蛛丝马迹,“风报” 要利用数据分析为企业提供情报 在关于企业信息的数据供应商中,我们曾报道过一款企业信息查询工具 “启信宝”,这家诞生于去年3月 的产品在六个月的时间里,从一个微信服务号扩充至 iOS、Android、Web 客户端,并于 9月 份获得 3000 万融资,目前已涵盖了全国 7500 万家企业的信用信息。 在占据行业领头羊地位相当一段时间后,启信宝要面临另一位竞争者的异军突起。在去年9月15日,也就是在启信宝刚刚获得新一轮融资的时候,另一款基于政府公开信息、媒体信息、社会信息的企业情报系统 “风报” 正式发布。 和启信宝通过征信中心与连接相关征信网站数据接口的获取方式相比,风报对企业信息的搜集则是依托了它们前期建立起来的核心自然语言分析技术 “玻森数据”,利用散落在全网中的企业外部文本数据,从海量的企业事件角度切入,展现企业及其管理者的情报,挖掘潜在风险。 在风报的创始人及 CEO 李臻看来,仅仅用 “企业数据查询” 来描述风报的功能有些单薄,他们更愿意用 “企业情报分析” 来形容这款系统,事实上,风报的诞生也不是一蹴而就的。2012年4月,风报的母公司玻森数据上线了全套 NLP(Natural Language Processing 自然语言处理系统)引擎及语料数据库,专注于自然语言处理技术的研发及应用,并使用这套系统为汽车、快速消费品等品类进行市场反馈、产品研发等方面的数据支持。 这听起来似乎很晦涩,但落实在现实操作中其实不难理解,玻森曾为大众点评上面的某个商家进行过口碑方面的典型意见分析,通过对非结构语言的转化以及词性色彩的判定,能够为餐厅提供在服务、消费场景、品牌个性、价格等方面的建议。 在玻森数据引擎的支撑下,李臻与其他合伙人进一步开发了风报产品,以面向企业信息查询这一垂直细分领域。在李臻看来,政府对公开信息的扩大化也是促进他们推出风报系统的另一点原因。 “有 80% 的商业情报都以非结构化的自然语言文本形式存在于网络的各个角落,但没人处理这些信息。” 李臻对记者说道,不论是政府公开信息,还是公司的热点事件,这些文本内容都夹杂在政府官网、新闻媒体、社交媒体等位置。 通过对非结构化数据的挖掘,风报要做得就是定位于工商、涉诉、税务、行政处罚、投融资、高管变动、企业经营业务等重大事件报道,对企业交易对手、竞争对手、合作伙伴、行业公司直接进行审查评估。 比如在风报系统中对乐视网信息技术(北京)股份有限公司进行搜索,页面中就会出现一栏非结构化事件的信息分类,一栏以时间轴分析事件分类的企业动态,这种多信源、跨数据源的信息聚合,能对企业在经营过程中的关联信息进行集中展示。 对于企业与企业、企业与个人之间的关系,风报还可以通过对司法文书的语义分析,得出隐藏在他们背后的关联体系,目前 “风报” 系统为用户提供三类关系的挖掘:分别是基于法律关系的多层企业投资及被投资关系;基于司法的企业与企业或个人间涉案关系;基于海量重大事件的企业间关系。 当谈及与 “启信宝” 的差别,李臻当即为我进行了两款软件的使用对比,在对某一公司的信息查询中,风报能够的法律文书信息为 730 条,而启信宝提供的信息数量为 400 余条,另外,风报能够实现的时间轴、交叉系统展示也是启信宝暂时没有的。 不过,从目标受众来看,启信宝拥有更多的 C 端用户,其企业查询服务也为免费使用。风报则定位于纯企业端用户,以收取 5 万 8、13 万 8 至百万不等的年费实现营收,目前已积累了 400 多个企业用户。 目前风报已完成数千万级的 Pre-A 轮融资。团队方面,风报联合创始人李臻是一位连续创业者,在商务拓展与政府合作中积累了颇多资源;纪敏曾长期服务于知名咨询公司及上市公司,具有丰富的商业经验;另外两位联合创始人闵可锐、赵迎宾均毕业于知名高校,在海外深造后回国参与风报的技术团队打造和产品研发。 来源:36氪,作者:苏建勋,如若转载,请注明出处:http://36kr.com/p/5041817.html
    数据分析
    2016年01月05日
  • 数据分析
    多维数据挖掘分析,Sensors Data想成为企业发展的动力源 来源:猎云网(微信:ilieyun) 文/马凤仪 此前Sensors Data在猎云网公布了天使轮的融资消息后,据创始人桑文锋反馈,文章发布后几小时,就受到了诸多vc关注,其中不乏有投资界的大佬。 接下来将着重介绍下Sensors Data的业务模式。 大数据的本质是一种数据驱动的理念外加技术,在数据源体量一般的情况下,就算没有复杂的技术,也能实现一些效果,但要想对体量庞大的数据进行多维度深层挖掘,就会面临一些技术上的挑战。 桑文锋在百度做了八年的数据统计分析工作,今年4月出来创立了Sensors Data。 桑文锋认为,数据人才对于创业公司来说又稀又贵,并且数据分析类产品建构并不是一两个人短时间就能完成的,所以他带领他在百度共事多年的伙伴做了一款数据分析工具Sensors Analytics(神策分析),其目的就是想要为创业公司提供专业的数据分析服务。 除了分析工具之外,Sensors Data 依托团队以往的大数据领域的技术和项目经验,也对外提供相应的技术咨询服务。服务的技术方向包括: 1、海量数据下的数据处理平台、数据仓库等大数据基础设施的建设和维护; 2、数据打印、传输、存储、建模、应用等数据实时和批量处理流程的构建、维护和调优; 3、基于用户数据的数据智能应用,包括用户画像、个性化推荐、用户生存周期分析、作弊用户识别等; 4、工业大数据领域方面,工业传感器的数据采集、传输、存储,以及相应的应用,包括数据的多维分析与可视化以及故障预测和诊断等。 提供的服务的形式包括: 相应领域技术专家的专业咨询服务;相应领域技术人员的培训;项目技术方案的设计和评审,代码的review;系统的故障辅助分析和排查,性能调优。 桑文锋强调:“Sensors Analytics是一款纯粹的数据分析工具,不会占有用户的任何数据。”他们既可以向普通企业用户提供Cloud版,也可以为对数据安全有顾虑的企业用户提供私有部署版。需要强调的是,桑文锋在向笔者演示多维度交叉分析的过程时,其反应速度已达到秒级。 与Sensors Analytics对标的产品已经有很多,国外的GA(Google Analytics)、MixPanel;国内的百度统计、友盟等。GA主要是通过用户访问情况和网站使用情况帮助企业衡量销售与转换情况;MixPanel主要针对用户行为分析而非访问量。与Sensors Analytics相比GA等产品只能覆盖前端JS/APP SDK记录的数据,是无法覆盖服务端和业务数据库的数据;从分析能力来说,国内GA类的产品只具备宏观分析能力,企业使用时并不能驱动企业运营以及个性需求。 于是,为了让数据发挥最大价值,在Sensors Analytics数据分析工具的基础上,他们又推出了数据咨询服务,已组建专业的资深数据分析团队,提供配套大数据咨询服务,咨询服务分为多维分析指标体系建设、事件设计及实施指导、数据分析和决策指导,其收费标准是5000~8000元/小时。此外,技术服务方面的收费根据数据量及业务复杂度来计费,价格在2~20万元/年之间。目前服务客户多为电商和O2O类创业公司,其中包括爱鲜蜂、多盟、AcFun、快快鱼、PP租车、51Offer等。 Sensors Data的技术团队一共有12人,大多来自百度。核心创始人桑文锋、曹犟、刘耀洲、付力力均来自百度大数据部,创始人兼CEO桑文锋2007年加入百度,从2008年底开始组建并带领团队,从零实现了百度用户日志的大数据平台,覆盖数据收集、传输、元数据管理、作业流调度、海量数据查询引擎、数据可视化等。他曾带领团队打造的系统有:LSP日志统计平台、Logdata用户行为查询平台、User Profile Service 1.0、User Data Warehouse 1.0、Biglog平台、Minos日志传输系统、LS 2.0作业流调度系统、Wing计算引擎、OLAP Engine等。 据了解,Sensors Data正在积极筹备下一轮融资。
    数据分析
    2015年12月21日
  • 数据分析
    “日志易” 获红杉 6000 万人民币 A 轮投资,预计明年盈利 图片: Yestone.com 版权图片库 近日,“日志易” 获得由红杉资本投资的 6000 万人民币 A 轮融资。此前在 2014年3月 时,该公司获得过真格基金领投的 1400 万人民币天使轮融资。 此前报道过 “日志易”,技术部分不过多阐述。它对标美国的 Splunk(之前市值 100 亿美元左右,现在市值 70 多亿美元。),定位在做实时大数据的搜索分析引擎。通俗来说,操作任何计算机软件、IT 系统时都会记录一条信息,也就是产生日志。“日志易” 就是基于这些数据在做搜索、分析、可视化,可以应用在运维监控、安全审计、用户及业务数据分析等领域。举例来说: 运维监控,就是应用在系统出故障时可以及时定位问题的原因,常见场景包括访问数据、访问接口、软件系统内部核心链路、软件系统对其依赖系统的访问情况以及系统异常等。 安全审计,就是当企业遭受到攻击时都会在日志留下痕迹,日志分析能够协助 IT 人员实现网络故障排查、网络安全审计、安全信息与事件管理、日志统一归档等。此前日志易还给北京公安局以及公安部一所做过案例。 用户及业务数据分析,例如,用户在电商买东西时,查看的哪些商品、放进购物车的都会有日志记录。再例如,百度关键词投放,被谁点击了,停留的时常等,也都是通过日志计算出来的信息。 日志易的创始人兼 CEO 陈军强调,他们在做的事情,不仅要强调数据量大,更多的是需要速度够快,百度的搜索引擎只能搜索几分钟之前的信息,而日志易可以搜索到几秒钟之前的信息。 值得一提的是,日志易的创始人兼 CEO 陈军先后在思科、Google、腾讯和高德做技术高层。日志易负责市场销售的汤滨曾就职 IBM、SAP 和 Splunk 等企业的销售职位 。日志易的团队吸纳了来自腾讯、百度、阿里、360 等互联网公司的研发人才。 目前日志易的企业客户分两部分,一部分是需要私有云定制部署的大中企业,大概在 100 多家,包括中国平安、国家电网、中国移动、乐视等;另一部分是为中小企业服务的 SaaS 标准版本。预计明年公司可以实现盈利。   来源:36氪 作者:徐宁 出处:http://36kr.com/p/5040900.html
    数据分析
    2015年12月10日
  • 数据分析
    秉承“一个萝卜一个坑”的人才观念,找萝卜如何做一站式招聘管理平台 来源:猎云网(微信:ilieyun) 文/小蒙 近来,融资很难进来,所以“开源节流”这个词被频繁提及着。其实,所谓的开源与节流是一个公司一直都应有的精神,一方面能花更少的钱办相同的事儿,说明公司能力强;另一方面,剩下来的的钱不正好可以为公司更好地开源吗?“谁都和钱没愁”,个体如此,公司亦如此。 很多2B的企业那真是门庭若市,为什么公司愿意为这些2B企业的各种服务埋单呢?面儿上看,企业是为他们掏钱了。往里瞧,其实这些2B企业是能为他们带来长远盈收效益的。那如果这还是一个免费的2B企业呢? 找萝卜是一家免费HR SaaS一站式招聘管理平台。 谈到为什么会做2B服务时,找萝卜CEO付浩告诉记者:“我们的团队之前就在做人力资源管理,同时我们也发现目前互联网创业的大背景下,注册的创业公司大概50%都是互联网企业,不管他们是什么类型的,人员招聘是逃离不了的话题。” 找萝卜把自己的用户服务对象定位为20-200人的创业型公司,帮助他们解决公司的招聘难题是找萝卜的创建初衷。付浩说:“由于初创企业人才需求量大,而且这类型公司的人员流动也很大,所以,找萝卜要解决创业公司人员招聘成本高、效率低的问题。” 创业公司的HR或者是当他们还没有HR这个职位却需要招聘员工的时候,不管是HR还是招聘人员都会手忙脚乱的,因为首先他们面对的第一个问题就是去哪里招人,再往后就更不敢想了。所以,对于创业公司来说如何提高招聘管理效能就是道难题了。找萝卜的核心课题和工具产品的价值就体现在它能够提供低门槛、高价值的产品与用户服务。找萝卜也希望贯穿“一个萝卜一个坑”的人才观念,竭力帮助企业寻找到属于自己的优秀人才。找萝卜的价值是通过它三大核心算法来体现的。 一键发布:找萝卜一键将招聘信息免费分发到国内主流的招聘渠道,对于创业公司来讲,省的是时间成本,无需再挨家挨户落实招聘信息了。 简历简析:付浩说:“目前光标准格式的简历模板就有18种,这就给要在十几二十秒内找到他们关注的信息的HR带来了很大的障碍,更别说还有那些自设的简历形式了。”找萝卜则可以在企业收到简历后,将其统一为“找萝卜”模板,这样HR就一目了然了。找萝卜还开放了实时更新的人才数据库,为创业型企业提供免费的简历下载服务。 基于一键发布和简历简析,通过大量的数据沉淀,找萝卜将实现简历的精准推荐与匹配。 简化管理:找萝卜平台可以随时标注简历状态,提高HR工作效能,帮助企业灵活管理自己的人才库。 找萝卜切中招聘这一高频需求,优化多平台简历筛选与管理体系,通过适度匹配商业化环节打造萝卜管家,覆盖社保、薪酬等人力资源模块,为中小型创业团队提供优质便捷的人力资源SaaS服务。付浩说:“社保和薪酬对于创业公司HR来说,是两个仅次于招聘的刚性需求,相关产品找萝卜正在开发中。” 找萝卜产品8月28日正式上线后,用户量在3个月时间达到了5300家,日活25%-30%之间,平均日增长活跃简历5000+,发布近3万个职位。 找萝卜团队目前30多人,其中5位合伙人,公司正在洽谈A轮融资。
    数据分析
    2015年11月26日
  • 数据分析
    调查了全球2000多名企业家后,Salesforce总结出20条未来数据分析发展的结论 今年年初,普华永道发布了一份针对77国逾1300位CEO的调查。结果显示,在推动数字技术发展、提高组织能力方面,数据挖掘分析占有第二重要的战略地位,仅次于提高客户参与度的移动技术。同时,这些CEO还认为,数据分析对于提供更好的客户体验并提高业务效率来说是一最为重要的一项能力。   需要注意的是,数据本身并不能提供洞识。如果数据分析的结果无法在组织内部分享和公开,那就无法促进业务成果和运营效率的最优化。   如今,我们面对着一道“消费者鸿沟”。没有洞识的数据是毫无价值的。国际数据中心的数据显示,企业平均分析到的数据只占其可用数据的不到1%。剩下那没有分析的99%会对公司造成什么样的影响? 大数据就是21世纪的石油,但数据本身是不会说话的。如果你不知道如何使用数据的话,它就毫无价值可言。这就好比石油,它本身也只是一团黏糊糊的东西,直到有人将它提炼成燃料。从大数据提炼出来的燃料就是企业的专有算法。专有算法能够解决执行中的具体问题,将会成为未来成功企业的秘密武器。下一轮数字淘金热的重点,就在于如何用数据来进一步做文章,而非仅仅处理数据。这才是算法经济的未来。 ——Gartner高级副总裁兼全球研究主管彼得·森德高   说到利用算法来实现价值,组织和企业都面临着巨大的机遇。但要做到这一点,企业必须发展自身的分析能力。要想发展出算法,企业必须抓住数据、分析数据,并将研究结果反馈到整个系统里(即所有利益相关方:员工、合作伙伴和客户)。Gartner预计,到2017年70%的公司将会发展出各自的分析中心。   而当今的企业是如何利用数据分析取得竞争优势的呢?为了了解企业现在的数据分析情况,我们调查了全球的2000多位企业领导,主要研究以下三个问题: 数据分析在当今企业中的角色转变 数据分析的运用在哪些领域呈上升趋势 杰出企业(high perfomers)如何利用数据分析   根据调查,我们有如下重要发现: 数据分析跃为企业的战略重心。有90%的杰出企业表示,数据分析绝对是他们制定整体战略和改善运营成果的关键。 数据分析的应用案例急剧增加。杰出企业大量使用数据分析的可能性是落后企业的3倍,他们能在十多个领域中收集有价值的信息,平均分析的信息类别超过17种——这个数字几乎是落后企业的2倍。 实时分析的时代已经到来。杰出企业利用现有分析工具获取及时有效信息的能力是落后者的5.1倍。 杰出企业欣然采纳这种新的数据分析文化。顶尖团队里过半员工使用分析工具的可能性是落后团队的2倍。   经过分析,我总结出了20条重要结论。 1. 到2020年,杰出企业有效分析的数据源数目将会增长150%,从2015年的20个数据来源增长到2020年的50个以上。   2. 缺乏自动化技术会给数据分析制造痛点。   以下是数据分析的十大难点: 需要手动将所有数据源导入到一个视图中; 太多数据不能得到分析; 花费过多时间更新电子数据表; 分析者是业务分析师,而非终端用户; 产出分析结果的周转周期太长; 数据不能为终端用户定制; 不能灵活地根据需求提供数据分析结果; 企业用户无法完全相信业务成果; 缺少迅速创建报告的自助服务接口; 不能解答关键的商业问题 总的来说,建立数据驱动型文化的关键在于三点:数据整合和定制的自动化,确保数据源的可信度,以及移动设备的实时报告。   3. 数据分析对制定企业战略至关重要。 杰出企业更可能将数据分析视为战略制定和改善运营成果的重点,是落后企业的8.2倍。84%的杰出组织表示,到2017年,数据分析的重要性就会大幅提升。   4. 针对数据分析的投资将会增长。 到2017年,杰出企业在数据分析方面的投资提高至少50%的可能性是落后企业的6.4倍。   5. 到2017年,企业领导将会在以下领域的数据和分析方面投入更多资源: 工具和技术(51%) 人才(35%) 培训(35%)   在我看来,各个行业的企业领导人应当投入更多资金招揽数据和分析专才,比如数据科学家。杰出企业也应设立首席数据官(CDO),并投资建立中央分析中心,这样就能精简最佳实践模式的应用过程,针对企业实际情况开展具体的分析培训。在客户关系管理和分析平台方面的投资可以使分析结果的获取、定制和传递更为大众化,同时大幅提高业务敏捷性,便于达到预期成果。   6. 除了简单的保留记录,杰出企业更有可能利用数据推动实质的企业决策,其可能性是落后企业的4.6倍。 在制定企业决策时,落后企业依靠自身直觉而非数据的可能性是杰出企业的5.7倍。我曾经当过首席客户官和首席营销官,从我的经验来看,只有数据驱动的企业才能持续保持业务优势。   7.数据分析正逐渐遍及每个业务领域。 以下是数据分析的十大优势: 提高运营效率 促进增长 优化运营过程 改善现有产品、服务和特点 找到新的收益来源 产生新的想法,推动创新 监管消费者行为 预测消费者行为 改善员工之间的合作 提升决策速度和准确性   从我的经验来看,杰出的数据驱动型组织能够从数据分析的描述功能(即描述过去)进化到预测功能(基于回归分析预测未来趋势)和规范功能(基于预测结果改变企业行为,从而取得预期成果)。为了尽可能提高分析水平,企业必须动员全体成员,共同创造并保持数据驱动的思维模式,营造数据驱动式的企业文化。成功企业的所有决策都以客户为中心,他们利用数据来保证决策透明度、问责机制和以成果为导向的机制。   8. 杰出企业分析的数据源数量约为落后企业的2倍。   9. 杰出企业使用的十大数据源包括: 电子邮件 研究数据 交易数据 商业化数据 日志数据 企业系统数据 事件驱动数据 社交媒体 合作方数据 客户服务中心记录数据   10. 销售、市场和服务将引领数据分析革命。 到2016年,74%的销售主管会采用销售数据分析手段。杰出的服务团队高效利用数据分析的可能性是落后团队的19倍。54%的市场营销人员相信,数据绝对是建立深度客户合作的关键所在。   11. 速度、便捷性和相关性是关键的区分点。 杰出企业利用分析工具来收集实时商业分析的可能性是落后企业的5.1倍。从我的经验来看,能够在收集速度上拉开差距的组织最有可能实现或超越其内部预期和外部的客户预期。   12. 杰出企业利用移动分析手段的可能性是落后企业的3.5倍。 企业领导必须具备在何时何地都能做出明智决策的能力。 但是,移动并不等于智能手机或平板电脑。移动指的是能够在运作过程中始终工作良好的能力。除了在办公桌前,你要学会随时随地都能工作。移动分析则必须能在运作过程中实时提供分析。   13. 顶尖团队的管理层都会大力支持发展数据分析。 90%的杰出企业的管理团队都将自己的成功归功于分析工具和分析技术。这里有一个很重要的问题,所有的主管都应该问问自己——如何能让消费者相信我们的决策是明智的?今天,我们的经济体高度连接,谁能在没有数据支持的情况下做出正确决策?为了在未来赢得客户,企业必须利用数据获得洞察,迅速做出决定、采取行动,为客户、合作伙伴和员工提供真正及时且有价值的服务。   14. 数据要对所有员工开放,并且利于他们的理解和使用。 杰出企业给至少半数员工提供分析工具的可能性是落后企业的2倍。我的经验是,在所有员工都能够接触正确的工具和商业流程的前提下,给员工进行培训和授权是扩大规模的关键。企业往往会将获取分析数据和使用分析工具的权限限制在管理层和分析师之间,但这么做就限制了整个企业的视野和潜能。系统集成、数据质量、数据整合定制和移动性是激发公司上下共同分析结果、发展洞察的关键。这也解释了为什么说分析平台是成功的关键。   15. 杰出企业内部各类人员合作分析的可能性是落后企业的15.5倍。 这一点非常关键,因为销售、市场营销和服务的界限正变得越来越模糊。客户的预期要求我们重新思考、设计其业务程序,建立更为流畅协调的新模型,根据具体情况分析采取最佳行动。你必须广泛分享你的分析成果才能保持高效。假设你如果在跑一场接力赛,数据分析就是你的接力棒;想要赢得比赛,就必须完美并及时地传递这个接力棒。   16. 选择分析工具的5大决定性因素: 运用的速度和易用性 商业用户使用该工具的易用性 自助服务和数据发现工具 发掘和分享数据的移动性 云部署   17. 杰出企业更倾向于认为,选择分析工具的关键在于发掘和分享数据的移动性(即上文第四点)。   18. 92%的杰出企业强烈赞同一点:拥有数据分析能力对企业未来的成功具有战略性的意义。   19. 杰出企业更可能相信分析非结构化数据对于了解消费者行为具有重要意义,这是落后企业的5.3倍。 社交媒体数据就属于非结构化数据。在我看来,结合结构化和非结构化数据是发挥数据预测和规范功能的唯一有效途径,并需要向你的雇员、合作伙伴和客户反馈及时、具体、有价值的信息。   20. 企业高效利用数据分析手段的关键: 制定更灵敏的战略——利用数据分析来制定战略并衡量成果 扩大数据分析范围——推动跨部门合作 营造数据分析文化——使公司上下都能接触并使用分析工具 投资数据分析——越早投资越能确保竞争优势 采纳新兴技术——持续发展数据分析方面的竞争力   根据星座研究公司(Constellation Research)的分析,目前全球90%的数据是在过去一年里创造出来的。我们正处于数据科学革命的开端,想要生存并占据一席之地,就必须更多、更有效地利用数据分析手段和工具。企业要想成功,就必须投资数据分析工具和技术,发展自身的数据驱动型文化。   由钛媒体编译自Salesforce首席数据宣传官Vala Afshar的评论文章,王雨思/翻译,Joyce/编辑。 来源:钛媒体    链接:http://www.tmtpost.com/1478477.html
    数据分析
    2015年11月25日