# 简介

一叶故事荟的小简是谷臻在文摘领域的研究创新。小简的模型承袭了学界多年的研究成果,并对文摘技术在商业场景进行应用的多项弱点进行了针对性的强化。

首先,模型对文本进行分句和分词处理,然后将文本并行输送到几个分析单元进行不同侧重的语义分析,其中有的侧重语法层面的统计特征,有的侧重语义特征,有的侧重文本的高层次结构特征等。经这些分析单元处理之后,文本变成了一系列的“语义权重矩阵”,然后由一个加权单元综合这些结果,得到统一的语义矩阵,并最终输送到最后的排序器,使用谷臻改良过的图排序(Graph-ranking)算法进行最终的选择和输出。

另外由于加权单元的存在,小简还可以“动态”调整自己的“理解侧重”,来更好的适应特定类型的内容,比如新闻、学术著作等,从而得到更好的结果。