今日头条资深架构师解密算法:语义标签和隐式

  今天的顶级建筑师解密算法:语义标签和隐含语义特征都很好理解内容

  “语义标签的效果是检验公司的NLP(自然语言处理)的试金石。”1月11日,今天谈到“使算法开放透明”,高级算法架构师,科技大学中国曹博士喜欢面对行业开放的算法原理,消除了各界对算法的一些误解,同时接受了意见和建议。渠道,兴趣表达和其他重要的产品功能,您需要一个定义明确,易于理解的文本标签系统。 “所以,虽然隐含的语义特征对推荐很有帮助,但做好语义标注需要的不仅仅是隐含的语义特征,还需要做好语义标注。”曹欢欢说。目前,行业中的许多产品在提出建议时都依赖于省级成本的隐式语义分析。所谓隐式语义分析,当两个单词或一组单词出现在同一个文档中时,这些单词可以被认为是语义相关的。机器不知道一个字实际上是什么意思,不知道一个字是什么意思。 U盘和U盘这两个词经常混杂在文章中,大量的同时出现在Web上,机器会觉得这两个词是极其相关的语义。 iPhone和苹果手机,虽然一个是英文,一个是中文,但这两个词在同一个网页上大量出现。虽然机器还不知道iPhone或苹果手机是什么意思,它可以在语义上将“iPhone”“苹果手机”紧紧地翻译在一起。曹欢欢认为,尽管隐含的语义特征已经得到了推荐,但是如果你想让你的产品推荐更好的话,仍然需要在看似繁琐的地方工作,比如语义标签。中央电视台,新华社,人民日报等媒体机构以及阿里巴巴,腾讯,百度,美国使团,新浪,网易等科技公司的算法工程师和产品经理等百余名从业人员参加了本届一天打“让算法开放透明”的活动,分享之后,曹欢欢回答了公众关于算法的问题,包括今天如何启动冷启动,如何平衡广告和内容,以及如何准确地扩展实际工程用户兴趣图等问题,同时听取大家对今日头条算法的意见和建议。