#OD441. 音乐小说内容重复识别

音乐小说内容重复识别

题目解析和算法源码

华为OD机试 - 音乐小说内容重复识别(Java & JS & Python)-CSDN博客

OJ用例

题解 - 音乐小说内容重复识别 - Hydro

题目描述

实现一个简易的重复内容识别系统,通过给定的两个内容名称,和相似内容符号,判断两个内容是否相似;

如果相似,返回相似内容;如果不相似,返回不相似的内容。

初始化:给出两个字符串,一些相似字符对,如顿号和逗号相似,的和de相似,猪和潴,给出两个字符串的相似判断结果

输入:两条语句,给出是否相似,对于相似的语句,返回True和相似的字符对;对于不相似的内容,则返回第一个内容的不相似信息,方便后续补充

注意:

  1. 相似关系是 具有 传递性的。例如,如果"顿号"和"逗号"是相似的,"逗号"和"分号"是相似的,则"顿号"和"逗号"是相似的。

  2. 为了过滤一些无意义的信息,这里***可以匹配任意长度的内容,例如:

    给出相似对"(***)",""时,"异世邪君(人气玄幻作家)" 和 "异世邪君" 认为是相似,此时相似符号返回 *** 即可

  3. 不相似的内容,需要给出不相似的字符串,多处不相似的字符串用空格分隔

输入描述

第一行表示第一张专辑的专辑名,其中 0 < 专辑长度 ≤ 50

第二行表示第二张专辑的专辑名,其中 0 < 专辑长度 ≤ 50

第三行开始每行为相似的字符串,每行一组,每组字符串不超过10个

总共相似字符串行不超过10行

输出描述

第一行返回相似判断的结果,即True或者False

第二行开始返回相似/不相似的字符串,每行一组

用例1

输入

林汉达上下五千年
林汉达上下5千年
五 5 ⑤ 伍 wu

输出

True
五 5

用例2

输入

幸福de猪的个人专辑
幸福的猪的个人专辑
得 的
得 de

输出

True
de 的

用例3

输入

异世邪君(人气玄幻作家)
异世邪君
(***)

输出

True
(***)

用例4

输入

浩然爸爸讲成语
浩然爸爸讲论语
论语 三字经

输出

False
成语 论语