在查找替换中调用 AI ,即用正则查找一个文本,调用 AI 处理该文本,然后替换或补充 AI 生成的输出到原文本,可以极大地扩展了传统查找替换的能力:
智能内容生成与扩充 作用: 查找特定的关键词、短语或标题(用正则定位),然后调用 AI 围绕这些主题生成更详细的描述、解释、示例或相关内容,并将生成的内容插入到原文中或替换占位符。
文本改写与风格转换 作用: 查找需要修改的句子或段落(用正则匹配),调用 AI 将其改写成不同的风格(如更简洁、更正式、更通俗易懂)或修正语法/语病,然后用 AI 生成的新文本替换原文。
自动摘要与信息提取 作用: 查找较长的段落或文章片段(用正则定位),调用 AI 生成其核心内容的摘要,可以用摘要替换原文(用于精简文档)或将摘要添加到旁边作为注释。也可以让 AI 从匹配到的文本中提取特定信息(如人名、地名、日期、关键数据)并格式化输出。
多语言翻译 (Multilingual Translation): 作用: 查找特定语言的文本块(用正则定位),调用 AI 翻译成目标语言,然后用译文替换原文。
数据清洗与格式标准化 (Data Cleaning & Format Standardization): 作用: 查找格式不规范的数据(如日期、地址、电话号码,用正则匹配多种可能格式),调用 AI 理解其含义并转换成统一的标准格式,然后进行替换。
情感分析与内容打标 (Sentiment Analysis & Content Tagging): 作用: 查找评论、反馈或其他主观性文本(用正则定位),调用 AI 判断其情感倾向(正面、负面、中性)或识别内容主题,然后将分析结果(如情感标签 [positive], [negative] 或主题关键词)添加到原文旁边或替换特定占位符。
下面学习一下如何在查找替换中调用 AI ?
唐库 AI 编辑器的查找替换可以调用 AI ,还可以预览替换:
1 )预览替换功能,可以在替换前先预览一下,尤其使用正则表达式替换时有必要,避免出错;
2 ) AI 替换功能,查找一个词条,用 AI 处理该词条,替换为 AI 处理的结果;
3 )词条转换功能(例如转大写,转小写)。
1 ,正则表达式分组概念
要使用 AI 替换功能,需先了解正则表达式分组概念,不要害怕正则,现在什么都可以问 AI 了。
先看最简单的:
想把 123abc 中的字母数字顺序掉转,操作如下:
查找 123abc 替换为 abc123 就可以了。
但看起来毫无意义,还不如打字快,再看如下操作:
查找 (123)(abc) 选中支持正则,替换为 $2$1,发现真的替换为 abc123 了!
为什么呢?
小括号就是正则表达式的分组, (123)是第 1 分组,在替换里用 $1 代表, (abc)是第 2 分组,在替换里用 $2 代表,$2$1自然就将顺序调转了。
但这样看好像意义也不大,只能调转123abc啊?
再变形一下:查找 ([0-9]+)([a-z]+) 替换 $2$1 不变,这是什么含义呢?
[0-9]:表示 0-9 中间的任意数字字符;
[a-z]:表示 a-z 中间的任意字母字符;
+:表示重复前面的字符 1-n 个
这个式子就强大了,它能将所有数字在前字母在后的字符串掉转。
2 ,AI 替换功能:
查找一个词条,用 AI 处理该词条,然后替换或补充 AI 处理的结果,AI 是无所不能的,这也意味着唐库的查找替换无所不能,而且是批量的。
还是从最简单说起:
文章中有一些英文名字,想在其后补充“(中文名字)”,例如John,变为John(约翰),在唐库中如下操作:
查找:(?
问题:有大小形状相同的 3 个红色小球和 5 个白色小球,排成一排,共有多少种不同的排列方法? 答:因为是 8 个小球的全排列,所以共有 8!,共 40320 种排法。
用唐库的 AI 查找替换来解决如下:
查找:问题:(?
问题:有大小形状相同的 3 个红色小球和 5 个白色小球,排成一排,共有多少种不同的排列方法? 答:因为是 8 个小球的全排列,所以共有 8!,共 40320 种排法。 批:不正确,正确解法是 8!/(3!5!)=56 种。
是不是很神奇? 100 个学生的 100 道题,批改瞬间完成。解释:
问题:(?
预览替换,找到 7 处: 11 | 1 行 || shade 11 | 1 行 || shade,SHADE 11 | 3 行 || ruffle 11 | 3 行 || ruffle,RUFFLE
小写英文单词被转为大写,解释: toupper:唐库特殊命名,将分组内容转为大写; $@1:第 1 分组经过唐库处理后的内容 类似上面 toupper 这样的预定义名称唐库还有: 1 ) tolower 转小写功能 2 ) toupper 转大写功能 3 ) index 返回连续序号 12345 4 ) indexcn 返回连续序号一二三四五 5 ) len 返回捕获组匹配的字符的个数