-
知识图谱
以知识图谱呈现多源数据 PlantData获松禾资本天使轮投资
2012年,Google提出知识图谱的概念,表示世界万物是被分为概念和实体,而实体之间是相互联系而存在的。PlantData借此将非结构化数据进行结构化处理,以解决数据孤岛的问题。
铅笔道根据工商变动发现,PlantData(隶属于上海海乂知信息科技有限公司)已获得松禾资本投资。
2018年1月4日,上海海乂知信息科技有限公司的注册资本发生变更,由100.000000万元扩充至109.890100万元。同日,公司新增股东深圳市彩梦想一号创业投资合伙企业(有限合伙),后者为松禾资本的投资实体
图表信息来自“企查查”。
该公司主要产品为图谱数据智能平台PlantData。根据其官网介绍,PlantData以知识图谱技术为核心,致力于整合多源异构的数据。产品可服务于一线数据分析师、研发工程师、企业业务高管,帮助用户学习实践知识图谱技能、探索企业大数据深度业务。
PlantData消费数据的过程分为数据整理,数据链接,生成数据智慧3个步骤。其产品组件支持数据语义、网络关系、模型计算、智能问答4项功能,能够根据用户的数据和业务快速生成应用。
PlantData可为行业客户提供知识图谱解决方案:包括互联网文本采集、抽取与分析,多源异构数据整合、加工与挖掘,大数据存储以及行业知识图谱套件等数据底层构建和分析服务;同时也提供口碑分析、市场营销以及行为决策等上层应用。
为满足企业个性化需求,团队提供包括Saas服务、私有化单机部署、私有化集群部署在内的多种服务方式。
同时,PlantData也提供已完成链接的数据资源,例如:包括约3600万余条国内企业工商数据的金融图谱、含有约1500万条国内专利数据的专利图谱、覆盖超过15万条国内创业企业及5000余家投资机构数据的创投图谱。
PlantData官网展示到,公司合作伙伴覆盖证券、数据、科技情报等类型的机构和企业,包括中信建投、量子数聚、动点科技、上海图书馆、北京理工大学图书馆、上海交通大学、同济大学档案馆等。
同时,团队也和知识管理厂商蓝凌软件等建立了战略合作关系,致力于让数据智能更好的支撑商业智能和人工智能服务。
目前,PlantData已经积累了全国企业知识图谱、中外创投知识图谱、海洋鱼类知识图谱、全国专利知识图谱等案例。
编辑 | 赤橙
来源:铅笔道(ID:pencilnews)
-
知识图谱
面向数亿职场人士,“职得看”利用知识图谱实现精准个性化资讯推荐
在资讯过载时代,个性化推荐确实是一个为用户节省时间的重要机制。市场上出现了越来越多的资讯应用,比如今日头条、看荐、即刻等。
今日头条使用了推荐算法,根据用户过往的阅读行为作为用户兴趣,进行内容推荐,多有重复和冗杂;一点资讯在算法基础上增加了订阅的规则,提升推荐准确度。看荐除了使用算法,还将人工甄别引入到个性化推荐的链条中。
不过在AiLingual创始人吴羽君看来,市面上缺乏面向职场人士的更为专业的资讯应用。同时,现有的个性推荐缺乏拓展性,无法挖掘用户潜在的兴趣点。
因此拥有Google工作背景的吴羽君,联合斯坦福大学硕士林咏为创立了AiLingual,并着手开发面向职场人士+大学生的拥有个性化推荐功能的资讯应用“职得看”。
说起“个性推荐”,今日头条是国内当仁不让的先行者。今日头条的推荐算法,是使用“协同过滤”技术提取用户兴趣的特征,然后和相应内容进行匹配。“协同过滤”主要依据的是用户或者项之间的相似性,即在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。早期的今日头条通过预装获得了巨大的用户基础,因此“协同过滤”技术路线是走得通的。
在没有足够的用户量基础上,AiLingual选择建立知识图谱来推测用户可能感兴趣的话题,并做相关性的推荐。知识图谱可以看作是一种复杂的树状图,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱提供了从“关系”的角度去分析问题的能力。
吴羽君表示,由于很多文本、图片、音频、视频等都是未经处理过的非结构化数据,因此需要掌握机器学习、数据挖掘、自然语言处理等技术,从这些非结构化数据中提取出有价值的信息。此外对团队的知识推理能力也提出了较高的要求。AiLingual自去年底开始着手建立“科技互联网”相关的知识图谱,对2500万+个实体、7万+的话题、700+的互联网科技相关专题进行了清洗、筛选,最终完成了上万个实体的知识图谱的建立。
梳理出这些实体间的关系,除了可以进行相关内容的推荐,还可以帮助用户挖掘和推荐他们潜在的感兴趣的话题。吴羽君举了个例子:比如实体“A”和实体“B”看似不相关,但其实是有一定强逻辑关联的。一个关注了大量A话题的读者,我们会尝试给他推荐B话题相关的内容,看看是否会引起他的关注和兴趣。
知识图谱的建成后,吴羽君团队也是通过内容提取(关键词匹配、内容分析等)做机器学习,将话题和文章对应起来。吴羽君告诉36氪,现在的匹配精确度大概能达到80%-90%。未来随着算法的优化和内容量的增加,匹配精度也将提升。同时,团队也在拓展除科技互联网外的其他领域内容,并不断加入新的实体。
用户也可以以专题形式定制自己感兴趣的内容,“职得看”上现有包括15个领域的大量专题内容,每个专题包括相关的资讯、观点、深度报告、音频、视频等。
吴羽君告诉记者,他们监测了绝大多数的科技互联网内容源,包括相关的网站、上千个微信公众号、知乎专栏、海内外博客等。未来还将拓展至除科技互联网外的其他知识领域,预期可以覆盖几亿的职场人士和大学生。
职得看现在有几百个核心用户,这些用户可以对推荐的内容是否满意进行多维度评判,从而帮助职得看调整和优化知识图谱结构或是内容提取算法。普通用户则是通过其是否对推荐的文章进行了阅读、浏览时间、是否分享了、收藏了等方式来进行正负反馈的判断。
不过APP的平均获客成本高是众多公司面临的挑战。吴羽君表示,他们还是着重在目标人群关注的地方推广产品,比如通过在知乎、简书上产出内容进行用户转化,以及基于产品本身功能结合社会热点做一些活动。
在盈利方面,吴羽君表示2C业务主要是通过广告或是专栏订阅等内容付费服务进行盈利。此外,职得看的内容推荐功能也可以通过API接口接入智能音箱系统中,为用户提供音频内容,在拓展盈利途径的同时,还可以扩大用户量。音频来源除了已有的音频内容,吴羽君还计划自行产出音频内容。
公司于去年获得了峰瑞资本数百万元的天使轮投资,8月份将开启Pre-A轮融资,主要用于团队的拓展、APP迭代和推广。
职得看的核心团队成员毕业于斯坦福,CMU,清华,北大,交大,拥有Google、Uber、搜狗等科技公司工作背景。创始人吴羽君曾任棕榈大道联合创始人& CTO,负责搭建稳定可规模化的服务器系统。曾在Google NestLabs担任UX工程师,有丰富的全栈开发经验。同时还入选了2017 Forbes 30 under 30 China。联合创始人林咏为斯坦福大学硕士,在硅谷明星企业Lark担任首席iOS工程师4年多,同时也是连续创业者。
来源:36氪,作者:希大,如若转载,请注明出处:http://36kr.com/p/5085370.html
扫一扫 加微信
hrtechchina