Skip to main content
QUICK REVIEW

[論文レビュー] Using Text-to-Image Generation for Architectural Design Ideation

Ville Paananen, Jonas Oppenlaender|arXiv (Cornell University)|Apr 20, 2023
Design Education and Practice被引用数 10
ひとこと要約

この研究は、テキストから画像へ生成するツール(Midjourney、Stable Diffusion、DALL-E)が建築の初期段階の発想をどのように支援できるかを検証し、建築学生を対象としたラボ研究を通じて潜在的な利点と課題を示している。

ABSTRACT

The recent progress of text-to-image generation has been recognized in architectural design. Our study is the first to investigate the potential of text-to-image generators in supporting creativity during the early stages of the architectural design process. We conducted a laboratory study with 17 architecture students, who developed a concept for a culture center using three popular text-to-image generators: Midjourney, Stable Diffusion, and DALL-E. Through standardized questionnaires and group interviews, we found that image generation could be a meaningful part of the design process when design constraints are carefully considered. Generative tools support serendipitous discovery of ideas and an imaginative mindset, enriching the design process. We identified several challenges of image generators and provided considerations for software development and educators to support creativity and emphasize designers' imaginative mindset. By understanding the limitations and potential of text-to-image generators, architects and designers can leverage this technology in their design process and education, facilitating innovation and effective communication of concepts.

研究の動機と目的

  • 建築設計のあいまいなフロントエンドにおいて、そのままの状態のテキストから画像への生成ツールが創造性を支援できるかを評価する。
  • 概念開発における発想、アイデア発見、創造的思考に対する生成ツールの影響を検討する。
  • 創造性を促進するための課題を特定し、ソフトウェア開発者と教育者に向けた実践的な配慮事項を提供する。

提案手法

  • 文化センターの概念設計を行う17名の建築学生を対象にした3セッションのラボ研究。
  • 参加者は基本的なプロンプトを用い、高度な機能を使わずに3つの生成ツール(Midjourney、Stable Diffusion、DALL-E)を使用した。
  • Creativity Support Index(CSI)調査と半構造化グループインタビューを通じてデータを収集。
  • プロンプトとシーケンスを分析し、プロンプト戦略と言語を理解した。
  • 創造性支援とツールの限界に関する洞察を得るため、参加者の討議を質的分析。

実験結果

リサーチクエスチョン

  • RQ1テキストから画像への生成ツールは、初期段階の建築設計における創造性と発想をどのように支援できるか?
  • RQ2既成のテキストから画像への生成ツールは建築設計にどの程度有効で、開発者は今後どのような点を考慮すべきか?
  • RQ3初心者ユーザーがテキストから画像への生成とプロンプティングを使用する際の典型的な課題は何か?

主な発見

サブファクター平均因子数(標準偏差)平均因子スコア(標準偏差)平均重み付き因子スコア(標準偏差)
Collaboration0.47 (0.87)6.88 (5.24)3.24 (4.58)
Enjoyment2.53 (1.18)17.1 (1.96)43.30 (2.32)
Exploration4.41 (0.62)14.1 (2.87)62.28 (1.77)
Expressiveness3.00 (1.27)14.9 (3.21)44.82 (4.09)
Immersion2.12 (1.17)11.5 (3.89)24.29 (4.54)
ResultsWorthEffort2.47 (1.55)15.7 (2.42)38.80 (3.74)
  • 設計の制約と想像的な発想を考慮した場合、画像生成は初期設計の意味ある一部となり得る。
  • 生成ツールは偶発的なアイデア発見と想像力豊かな思考を支援し、設計プロセスを豊かにする。
  • CSIの結果は、3つのツール間で創造性支援に有意差を示さないが、サブ要因の重要性は異なる(ExplorationとEnjoymentが顕著)。
  • プロンプトは記述的で設計ブリーフに沿う傾向があり(例: floorplan, facade)、アイデアごとのシーケンスは平均約8プロンプト、最大で24プロンプトのシーケンス。
  • 平面図の生成は難しく、標準的な図面より非伝統的でカラフルまたは3D表現が多くなることが多かった。ファサード材料の生成は、内装ビューより難しかった。
  • 参加者は編集/洗練の可能性、制約の組み込み、従来のCAD風ワークフローとの統合といった特徴を評価した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。