五、结构信息和语法
语法决定了人脑中由概念按照特定结构组织的结构信息如何表达。我们可以类比到积木,这些积木对应到属性层的概念,它们毕竟是有限的,所以可以每个都被命名,但有限的积木可以进行无穷的组合。所以我们往往不会用词汇直接去对应每个组织生成的结构信息,而会用组成这个结构信息中的概念对应的词汇,把这些词汇组合成句子去表达一个先天语言中的结构信息。
举一个例子,对于一条自然语言下表述的知识“猫是哺乳动物”,描述两个抽象概念“猫c”和“哺乳动物c”之间的从属关系,在M语言中是这样一个节点:IDA(子类=猫,母类=哺乳动物)。我们来考察文字信息流“猫是哺乳动物”到M语言信息IDA(子类=猫,母类=哺乳动物)之间是如何相互转化的。
我们看到自然语言的文字信息流实际上是包含着结构信息的,结构信息一般有两个载体:能够对应到概念的那些词汇的语序,比如“猫w”+“哺乳动物w”;掺杂在语序中的结构性词汇,如“猫w”+“是”+“哺乳动物w”中的“是”,这个词汇不对应到任何的概念。
“当我们学习一门语言的时候,实际上包含了两个内容:这门语言词汇到概念的对应;这门语言约定文字信息中的结构到先天语言中结构的对应,也就是我们说的语法。”
前者我们容易理解。这里我们看后者,在上面的例子中,我们需要学会的语法是这样的信息:“对象类1c”+是+“对象类2c”——(子类=对象类1c,母类=对象类2c)。于是正转录的过程可以描述为:
第一步:识别词汇。“猫w”+“是”+“哺乳动物w”识别词汇后的词汇信息流。
第二步:概念替换词汇。“猫c”+“是”+“哺乳动物c”词汇信息流中能够对应到概念的词汇用对应的概念替换。
第三步:搜索语法模板。根据“猫c”和“哺乳动物c”的概念属类是“对象类”匹配上语法模板:“对象类1c”+是+“对象类2c”——(子类=对象类1,母类=对象类2)。
第四步:生成结构信息。把对象1和对象2的具体内容写入生成:(子类=猫c,母类=哺乳动物c)。
逆转录的过程可以描述为:
第一步,生成表达语义:[主体信息=(子类=猫c,母类=哺乳动物c),表达类型=陈述]。
第二步,搜索语法模板,根据“猫c”和“哺乳动物c”的概念属类是“对象类c”匹配上语法模板:“对象1c”+是+“对象2c”——(子类=对象类1,母类=对象类2)。
第三步,生成概念参与的句子。在语法模板的句子结构中,把概念类替换为对应的概念,生成概念参与的句子。在这个例子中生成“猫c”+“是”+“哺乳动物c”。
第四步,概念替换词汇。把概念转为对应的词汇生成文字信息流:“猫w”+“是”+“哺乳动物w”。