Skip to main content
QUICK REVIEW

[论文解读] Quantifying principles of the narrative text formation.

Stanisław Drożdż, Paweł Oświȩcimka|arXiv (Cornell University)|Dec 29, 2014
Complex Systems and Time Series Analysis参考文献 24被引用 2
一句话总结

本文通过分析文学作品中句子长度变异性的(SLV),量化了叙事文本的形成过程,揭示了遵循普遍1/f标度(β ≈ 1/2)的自相似级联式句子长度交替模式。研究识别出分形与多重分形结构——尤其在意识流小说中——表明这些结构为叙事写作的审美吸引力提供了定量基础。

ABSTRACT

In natural language using short sentences is considered efficient for communication. However, a text composed exclusively of such sentences looks technical and reads boring. The text composed of long ones, on the other hand, demands significantly more effort for comprehension. Studying characteristics of the sentence length variability (SLV) in a large corpus of world-famous literary texts shows that an appealing and aesthetic optimum appears somewhere in between and involves selfsimilar, cascade-like alternation of various lengths sentences. A related quantitative observation is that the power spectra S(f) of thus characterised SLV universally develop a convincing ‘1/f’ scaling with the average exponent β ≈ 1/2 , close to what has been identified before in musical compositions or in the brain waves. An overwhelming majority of the studied texts simply obeys such fractal attributes but especially spectacular in this respect are hypertext-like, ”stream of consciousness” novels. In addition, they appear to develop structures characteristic of irreducibly interwoven sets of fractals called multifractals. These observations and results, beside their obvious interdisciplinary implications, open room for novel informetrics measures of potentially great applicability.

研究动机与目标

  • 探究文学作品中叙事文本形成的定量原理。
  • 考察句子长度变异性(SLV)对可读性和审美吸引力的影响。
  • 确定文学作品是否表现出与音乐和脑电信号类似的普遍标度模式。
  • 探究意识流小说是否比其他体裁展现出更复杂的分形或多重分形结构。

提出的方法

  • 分析大型世界著名文学作品语料库中的句子长度变异性(SLV)。
  • 计算SLV的功率谱S(f),以检测不同频率下的标度行为。
  • 测量1/f标度关系S(f) ∝ f^−β中的幂律指数β。
  • 比较不同体裁中的SLV模式,尤其关注类超文本的、意识流小说。
  • 通过分析交织的分形集合,评估多重分形结构的存在。
  • 使用信息计量学指标量化叙事复杂性与审美质量。

实验结果

研究问题

  • RQ1文学作品中的句子长度变异性是否遵循普遍的1/f标度模式?
  • RQ2在不同文学作品的句子长度变异性功率谱中,标度指数β的值是多少?
  • RQ3意识流小说是否比其他叙事形式展现出更强的分形或多重分形特征?
  • RQ4句子长度的自相似级联式交替如何促进叙事美学?
  • RQ5分形与多重分形分析能否作为文学复杂性与可读性的新信息计量学指标?

主要发现

  • 文学作品中句子长度变异性S(f)的功率谱普遍表现出1/f标度,平均指数β ≈ 1/2。
  • 这种1/f标度模式在技术效率与审美吸引力之间达到最优平衡,避免了句长一致导致的单调感。
  • 类超文本的、意识流小说在其句子长度模式中表现出特别强烈的分形与多重分形结构。
  • 这些文本的多重分形特性表明其包含不可简化的交织分形集合,暗示了复杂的分层组织。
  • 研究结果表明,句子结构中的分形与多重分形模式可能是文学作品感知审美吸引力与可读性的内在基础。
  • 这些模式为文学分析与文本评估提供了新型信息计量学指标的基础。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。