首頁 » 以这样的方式编写算法是有意义

以这样的方式编写算法是有意义

我们所说和所写的词语往往只有在语义背景下才能理解。只有这个上下文才能赋予单词和句子其意义。这同样适用于我们在网站上使用的词语。

例如,考虑这两个句子:1)“美洲写算法是虎从动物园逃走了。” 2)“邻居家的捷豹坏了。”这两个句子中的 jaguar 一词根据上下文而有所不同。根据 jaguar 这个词的两种不同含义,使用它的两个不同的向量空间是合理的。

因此,写算法是的,即在输入训练数据之前写算法是将文本分类为可能的语义上下文。这可以提高自然语言处理的有效性。

在上面的捷豹例子中,一个语义 电报数据 上下文可能是“汽车”,另一个可能是“动物”。该方法背后的方法也称为“框架语义”。上下文框架由某些属性定义。例如,语境框架“汽车”可能包括马力、驾驶员、油耗、空气污染等特征……我在之前的帖子中已经描述了一种类似的方法,关于按实体类型、事件等进行分类。更多信息请阅读: 谷歌如何识别和解释非结构化内容中的实体?以及  您需要了解的有关实体类型、类别和属性的所有信息。

这种方法令人兴奋的是,谷歌还可以使用它来对内容进行分类。换句话说,Google 定义了内容或文档的上下文框架,并可以使用它来确定主题和功能上下文。然后可以用它来确定内容是否与搜索词的搜索意图相匹配。

伯克利大学的框架网项目可以在这里 在整个广告系列中实施附加宣传信息 发挥作用。 FrameNet 项目正在创建一个可供人类和机器读取的英语词汇数据库。对实际文本中单词的使用示例进行了注释。这些评论是手动维护的,因此具有很高的准确性。

NLP 在搜写算法是索中的应用

我认为与Google搜索相关的写算法是自然语言处理主要应用于以下领域:

  • 搜索查询的解释(Rankbrain/BERT)
  • 文件主题和目的的分类
  • 文档、搜索查询和社交媒体帖子 目錄 中的实体分析
  • 对于精选摘要和语音搜索
  • 视频内容解读
  • 知识图谱的扩展和改进

关于2019年10月发布BERT更新的一些声明表明了自然语言理解对谷歌的重要性。

 

Scroll to Top