本发明公开了一种文本数据分类与信息挖掘方法,属于计算机技术领域。本发明通过利用根据实际数据建立的关键词库,使得文本特征向量的维数大大降低、信息集中,克服了文本大数据处理过程中高维‑稀疏的问题,便于支持向量机算法的实现。同时定义了隶属度差异化系数来选取可靠个体,以增强文本分类的准确性。进一步的,本发明在训练支持向量机之前,利用两层模糊分类初步得到其类别,无需提前获知训练数据的类别对于12345热线文本数据,本申请还提出了针对不同类别利用群体智能的方法对分类后的问题文本给出解决方案,能充分调动不同领域的专业人士给予解答。
商品类型 | 专利 | 申请号 | 201910481105.6 | IPC分类号 | |
专利类型 | 发明 | 法律状态 | 有权 | 技术领域 | |
交易方式 | 普通许可 | 专利状态 | 已授权 | 专利权人 |
¥ 21,000 元
¥ 10,000 元
¥ 110,000 元
¥ 10,000 元