查看: 5|回復: 0

子中单词的一半 这是本周授予谷歌

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2024-5-7 11:24:15 | 顯示全部樓層 |閱讀模式
请注意,这里有不同长度的 Ngram。 如果多个 Ngram 的锚点相同,则 Ngram 将被视为潜在的释义对。 该过程可以遵循多个规则来确定一对Ngram是否是释义。 例如,一项专利规定了以下规则: “可以评估一组文档中所有可能的 7 到 10 个单词的 Ngram,开头和结尾之间的长度可以是 1 到 4 个单词。 Ngram 作为一个句子 Ngram 是句子,因此判断一个句子是否为释义对时存在以下规则: 句子中的单词不得超过 30 个字符 句子必须至少有一个除动名词或情态动词以外的动词 必须至少是一个非动词且不以大写字母开头的单词 数字必须少于句的另一项专利: 释义 :Alexandru Marius Pasca、Peter Szabolcs Dienes 授予:Google 美国专利号:7,937,265 授予日期:2011 年 5 月 3 日 提交日期:2005 年 9 月 27 日 概述 用于从文本获取潜在释义的方法和装置,包括系统和计算机程序产品。


收到文本后,就会创建第一张地图。映射键是在文本中标识的 Ngram,并且与映射键关联的值是唯一标识符。第二张地图已创建。第二个映射的键是从 Ngram 中识别的锚点,与第二个键关联的值是与该锚点关联的中间部分。第三张地图已创建。第三个键是从中间部分识别的潜在释义对,与第三个 欧洲手机号码列表 键关联的值是与潜在释义对相关的唯一锚点(在多个的情况下)。 虽然我已经简要描述了用于识别释义的过程,但是专利可以通过多种方式识别释义,例如句子或句子片段之前的日期和时间,或者使用可以被识别为解释了已识别机制的细节。






例如,1989年发生上述“苏联撤军”事件时,网页上经常出现以下句子: 1989年——苏联军队撤出阿富汗 1989年——苏联军队从阿富汗撤军 通过使用在介绍此类事件的页面上张贴的日期和时间,预期具有增加日期和时间之后的片段是释义的可能性的效果。 同样,指定特定人、地点或事物的命名实体和状语关系从句也可能有助于识别网络上可能有释义的 Ngram。以下是该专利中描述的机制: 例如,句子“它们共同形成普拉特河,最终流入路易斯安那州最南端的墨西哥湾”包含三个命名实体:“普拉特河”、“墨西哥”和“路易斯安那”。

回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |