QUICK REVIEW

[논문 리뷰] Using Text-to-Image Generation for Architectural Design Ideation

Ville Paananen, Jonas Oppenlaender|arXiv (Cornell University)|2023. 04. 20.

Design Education and Practice인용 수 10

한 줄 요약

연구는 텍스트-투-이미지 생성기(Midjourney, Stable Diffusion, DALL-E)가 초기 건축 아이디어 구상 중 창의성을 어떻게 지원할 수 있는지 조사하고, 건축학과 студент들을 대상으로 한 실험실 연구를 통해 잠재적 이점과 도전을 보여준다.

ABSTRACT

The recent progress of text-to-image generation has been recognized in architectural design. Our study is the first to investigate the potential of text-to-image generators in supporting creativity during the early stages of the architectural design process. We conducted a laboratory study with 17 architecture students, who developed a concept for a culture center using three popular text-to-image generators: Midjourney, Stable Diffusion, and DALL-E. Through standardized questionnaires and group interviews, we found that image generation could be a meaningful part of the design process when design constraints are carefully considered. Generative tools support serendipitous discovery of ideas and an imaginative mindset, enriching the design process. We identified several challenges of image generators and provided considerations for software development and educators to support creativity and emphasize designers' imaginative mindset. By understanding the limitations and potential of text-to-image generators, architects and designers can leverage this technology in their design process and education, facilitating innovation and effective communication of concepts.

연구 동기 및 목표

일반적으로 제공되는(out-of-the-box) 텍스트-투-이미지 생성기가 건축 디자인의 흐릿한 초안(front end) 단계에서 창의성을 지원할 수 있는지 평가한다.
개념 개발에서 아이디어 발상, 아이디어 발견 및 상상적 사고에 생성기가 어떤 영향을 미치는지 검토한다.
도전과제를 식별하고 소프트웨어 개발자와 교육자들이 창의성을 촉진하기 위한 실용적 고려사항을 제시한다.

제안 방법

건축학과 학생 17명이 문화센터 아이디어를 설계하는 세션으로 구성된 3회 실험실 연구.
참가자들은 기본 프롬프트와 고급 기능 없이 세 가지 생성기(Midjourney, Stable Diffusion, DALL-E)를 사용했다.
참가로부터 Creativity Support Index(CSI) 설문과 반구조화된 그룹 인터뷰를 통해 데이터를 수집했다.
프롬프트와 시퀀스를 분석하여 프롬프트 전략과 언어를 이해했다.
참가자 토론의 질적 분석을 통해 창의성 지원 및 도구 한계에 대한 통찰을 도출했다.

실험 결과

연구 질문

RQ1초기 단계의 건축 디자인에서 텍스트-투-이미지 생성기가 창의성 및 아이디어 구상을 어떻게 지원할 수 있는가?
RQ2일반적으로 제공되는 텍스트-투-이미지 생성기가 건축 디자인에 얼마나 효과적이며, 개발자가 어떤 미래의 고려사항을 도입해야 하는가?
RQ3초보 사용자들이 텍스트-투-이미지 생성기와 프롬프트를 사용할 때의 일반적인 도전과제는 무엇인가?

주요 결과

하위요인	평균 요인 개수 (표준편차)	평균 요인 점수 (표준편차)	가중 평균 요인 점수 (표준편차)
협업	0.47 (0.87)	6.88 (5.24)	3.24 (4.58)
즐거움	2.53 (1.18)	17.1 (1.96)	43.30 (2.32)
탐색	4.41 (0.62)	14.1 (2.87)	62.28 (1.77)
표현력	3.00 (1.27)	14.9 (3.21)	44.82 (4.09)
몰입	2.12 (1.17)	11.5 (3.89)	24.29 (4.54)
노력 대비 결과의 가치	2.47 (1.55)	15.7 (2.42)	38.80 (3.74)

설계 제약과 상상적 아이디어 발상이 고려될 때 초기 설계의 의미 있는 부분이 될 수 있다.
생성 도구는 뜻밖의 아이디어 발견과 상상력 있는 사고방식을 지원하여 설계 프로세스를 풍요롭게 한다.
CSI 결과는 세 도구 간 창의성 지원에 유의미한 차이가 없음을 보여주지만, 하위 요인은 중요도에 차이가 있다(탐색과 즐거움이 두드러진다).
프롬프트는 기술서와 건축 설계 brief에 맞추어 서술적이었던 경향이 있으며(예: 평면도, 파사드), 아이디어당 프롬프트 수는 평균 약 8회, 최대 24회까지의 시퀀스가 있었다.
평면도 생성은 어려웠고 표준 도면이 아니라 비전통적이거나 색상 풍부한 3D 표현이 자주 나오며, 파사드 재료는 실내 뷰보다 생성이 더 어려웠다.
참가자들은 편집/정제 가능성, 제약 조건 반영, 전통적인 CAD 유사 워크플로우와의 통합과 같은 기능을 높이 평가했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.