正则表达式 – 有一个相当简单的方法让脚本告诉(从上下文)“她”是否是占有性代名词?

我正在编写一个脚本来反转一段文字中的所有性别,所以所有性别的单词都被交换 – “man”与“女人”交换,“她”与“他”交换,等等.但是有一种歧义是否应将“她”改为“他”或“他的”.
好的.让我们像语言学家一样看待这个.我在这里大声思考.

Her”是代名词.它可以是:

占有代词

This is her book.

人称代词

Give it to her. (after preposition)

He wrote her a letter. (indirect object)

He treated her for a cold. (direct object)

让我们看一下案例(1),所有格代词.也就是说它是一个代词,它处于“genitive”的情况下(意思是,它是一个“占有欲”的名词.好的,这个细节并不像下一个那么重要.)

在这种情况下,“她”充当“决定者”.确定者可能出现在一个句子的两个地方(这是一个简化):

Det + Noun (“her book”)

Det + Adj + Noun (“her nice book”)

所以要弄清楚她是否是一个决定因素,你可以有这样的逻辑:

一个.如果“她”之后的单词是名词,那么“她”就是一个限定词.

湾如果“她”之后的2个单词是形容词,那么名词,那么“她”就是一个限定词“

如果你确定“她”是一个决定因素,那么你就知道你必须用“他的”代替它,这也是一个决定因素(又名属性名词,又称占有代词).

如果它与上面的标准(a)和(b)不匹配,那么你可以得出结论它不是一个限定词,这意味着它必须是一个人称代词.在这种情况下,你会用“他”代替“她”.

你甚至不必进行下面的测试,但无论如何我都会尝试描述它们.

从上面看(2):人称代词,而不是占有欲.这变得更棘手.

上面的例子显示“她”以3种方式发生:

(1)给她. (介词之后.我们称之为“介词的对象”.)

所以你可以设计一个规则:“如果’她’在介词后立即发生,那么它应该被视为名词,所以我们将用’他’代替它”.

接下来的两个很棘手. “她”可以是直接对象或间接对象.

(2)他给她写了一封信. (间接宾语)

(3)他治疗感冒了. (直接宾语)

从句法上讲,我们如何区分?

直接对象在动词后立即出现.

如果你有一个动词,后跟一个名词,那么该名词就是一个直接的对象.例如:

他对待她.*

如果你有一个动词,后跟一个介词短语,那么名词就是一个直接的对象.

他对她感冒了. (“她”是名词,它在动词“处理”之后立即出现.“感冒”是一个介词短语.)

这意味着你可以说“如果你有动词名词准备”,那么名词就是一个直接的对象.由于名词是直接对象,因此它是人称代词,因此请使用“他”. (注意,你只需要检查介词,而不是整个预备短语,因为短语总是以介词开头.)

如果它是间接对象,那么您将拥有“动词名词名词”形式.

他给她写了一封信. (“她”是名词,“字母”是名词.好吧,“一个字母”是一个“名词短语”,所以你也必须考虑确定者.)

所以…如果“她”是直接对象,间接对象或准备对象,您可以将其更改为“他”,否则,将其更改为“他的”.

这种方法似乎要复杂得多 – 所以我首先要检查“她”是否是一个决定因素(见上文),如果它是一个限定词,否则使用“他的”,只需使用“他”.

所以,上面有很多简化.它不包括“打断短语”,或子句结构,选区测试,嵌入式条款,标点符号或类似内容.

此外,此解决方案需要字典 – “名词”和“动词”和“介词”列表,以便您可以确定句子中每个单词的词汇类别.

即使在那里,人,自然语言处理也很难.你想为你的模型做一些“训练”以获得一个好的解决方案.但是对于非常简单的事情,尝试上面描述的一些东西.

很抱歉这么冗长! (现有的答案都没有给出任何硬数据或精确的语言定义,所以这里有.)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


jquery.validate使用攻略(表单校验) 目录 jquery.validate使用攻略1 第一章 jquery.validate使用攻略1 第二章 jQuery.validate.js API7 Custom selectors7 Utilities8 Validato
/\s+/g和/\s/g的区别 正则表达式/\s+/g和/\s/g,目的均是找出目标字符串中的所有空白字符,但两者到底有什么区别呢? 我们先来看下面一个例子: let name = 'ye wen jun';let ans = name.replace(/\s/g, '&#3
自整理几个jquery.Validate验证正则: 1. 只能输入数字和字母 /^[0-9a-zA-Z]*$/g jQuery.validator.addMethod("letters", function (value, element) { return this.optio
this.optional(element)的用法 this.optional(element)是jquery.validator.js表单验证框架中的一个函数,用于表单控件的值不为空时才触发验证。 简单来说,就是当表单控件值为空的时候不会进行表单校验,此函数会返回true,表示校验通过,当表单控件
jQuery.validate 表单动态验证 实际上jQuery.validate提供了动态校验的方法。而动态拼JSON串的方式是不支持动态校验的。牺牲jQuery.validate的性能优化可以实现(jQuery.validate的性能优化见图1.2 jQuery.validate源码 )。 也可
自定义验证之这能输入数字(包括小数 负数 ) <script type="text/javascript"> function onlyNumber(obj){ //得到第一个字符是否为负号 var t = obj.value.charAt(0); //先把非数字的都
// 引入了外部的验证规则 import { validateAccountNumber } from "@/utils/validate"; validator.js /*是否合法IP地址*/ export function validateIP(rule, value,cal
VUE开发--表单验证(六十三) 一、常用验证方式 vue 中表单字段验证的写法和方式有多种,常用的验证方式有3种: data 中验证 表单内容: <!-- 表单 --> <el-form ref="rulesForm" :rules="formRul
正则表达式 座机的: 例子: 座机有效写法: 0316-8418331 (010)-67433539 (010)67433539 010-67433539 (0316)-8418331 (0316)8418331 正则表达式写法 0\d{2,3}-\d{7,8}|\(?0\d{2,3}[)-]?\d
var reg = /^0\.[1-9]{0,2}$/;var linka = 0.1;console.log (reg.test (linka)); 0到1两位小数正则 ^(0\.(0[1-9]|[1-9]{1,2}|[1-9]0)$)|^1$ 不含0、0.0、0.00 // 验证是否是[1-10
input最大长度限制问题 <input type="text" maxlength="5" /> //可以 <input type="number" maxlength="5" /> //没有效
js输入验证是否为空、是否为null、是否都是空格 目录 1.截头去尾 trim 2.截头去尾 会去掉开始和结束的空格,类似于trim 3.会去掉所有的空格,包括开始,结束,中间 1.截头去尾 trim str=str.trim(); // 强烈推荐 最常用、最实用 or $.trim(str);
正则表达式语法大全 字符串.match(正则):返回符合的字符串,若不满足返回null 字符串.search(正则):返回搜索到的位置,若非一个字符,则返回第一个字母的下标,若不匹配则返回-1 字符串.replace(正则,新的字符串):找到符合正则的内容并替换 正则.test(字符串):在字符串中
正整数正则表达式正数的正则表达式(包括0,小数保留两位): ^((0{1}.\d{1,2})|([1-9]\d.{1}\d{1,2})|([1-9]+\d)|0)$正数的正则表达式(不包括0,小数保留两位): ^((0{1}.\d{1,2})|([1-9]\d.{1}\d{1,2})|([1-9]+
JS 正则验证 test() /*用途:检查输入手机号码是否正确输入:s:字符串返回:如果通过验证返回true,否则返回false /function checkMobile(s){var regu =/[1][3][0-9]{9}$/;var re = new RegExp(regu);if (r
请输入保留两位小数的销售价的正则: /(^[1-9]([0-9]+)?(\.[0-9]{1,2})?$)|(^(0){1}$)|(^[0-9]\.[0-9]([0-9])?$)/ 1.只能输入英文 <input type="text" onkeyup="value
判断价格的正则表达式 价格的正则表达式 /(^[1-9]\d*(\.\d{1,2})?$)|(^0(\.\d{1,2})?$)/; 1 解析:价格符合两种格式 ^ [1-9]\d*(.\d{1,2})?$ : 1-9 开头,后跟是 0-9,可以跟小数点,但小数点后要带上 1-2 位小数,类似 2,2
文章浏览阅读106次。这篇文章主要介绍了最实用的正则表达式整理,比如校验邮箱的正则,号码相关,数字相关等等,本文给大家列举的比较多,需要的朋友可以参考下。_/^(?:[1-9]d*)$/ 手机号
文章浏览阅读1.2k次。4、匹配中的==、an==、== an9、i9 == "9i"和99p==请注意下面这部分的作用,它在匹配中间内容的时候排除了说明:当html字符串如下时,可以匹配到两处,表示匹配的字符串不包含and且不包含空白字符。说明:在上面的正则表达式中,_gvim正则表达式匹配不包含某个字符串
文章浏览阅读897次。【代码】正则表达式匹配a标签的href。_auto.js 正则匹配herf