eISSN: 2093-8462 http://jesk.or.kr
Open Access, Peer-reviewed
Young Hyun Kim
, Sangyeon Kim
, Sangwon Lee
10.5143/JESK.2025.44.4.463 Epub 2025 September 04
Abstract
Objective: This study aims to propose and validate a proactive agent framework that enhances usability and interaction efficiency through context-aware assistance in smart home environments. The potential of the framework is evaluated through a scenario-based user study using LLM-powered conversational agents.
Background: Advances in large language models (LLMs) have accelerated the development of proactive conversational agents that infer user intentions from context and provide support without explicit requests. While these systems address limitations of reactive agents, their usability and effectiveness depend on how well they align with the user's contextual needs.
Method: We conducted a within-subjects study with 18 participants to compare a proactive agent based on our framework with a reactive baseline. Participants completed six tasks across three smart home scenarios using a chat interface powered by LLMs. Usability and interaction efficiency were measured through surveys and prompt analysis, supported by qualitative insights from follow-up interviews.
Results: The proactive agent based on our framework demonstrated significantly higher usability, as measured by the SUS score. It also reduced prompt verbosity and quantity compared to the reactive agent, indicating improved interaction efficiency. Interview responses further supported these findings, with most participants preferring the proactive agent for its convenience, reduced cognitive effort, and ability to streamline routine automation through intuitive suggestions.
Conclusion: The results confirm the effectiveness of a user-centered, modular proactive agent framework in enhancing smart home interaction. Furthermore, the findings underscore the importance of personalized suggestion delivery, integration of user expertise, and mechanisms for transparent refinement based on user feedback.
Application: These findings offer design implications for more broadly applying proactive systems for automation beyond smart homes.
Keywords
Proactivity AI-based agent Large Language Models (LLMs) Chat interface Home automation
1.1 Background
대규모 언어 모델(Large Language Models, LLMs)의 발전은 선제적 시스템을 포함한 다양한 대화형 에이전트 시스템의 개발을 가속화하고 있다(Van Berkel et al., 2021). 선제적인 인공지능 에이전트는 상황 맥락 정보를 바탕으로 사용자의 의도를 추론하여 명시적인 요청 없이도 적합한 도움을 제공할 수 있다(Sarikaya, 2017). 최근의 인공지능 시스템은 사용자 행동 예측 정확도가 향상되어 능동적으로 적절한 도움을 제공할 수 있는 가능성이 더욱 높아졌다(Lu et al., 2024; Zhang et al., 2024). 특히 선제적 에이전트는 사용자가 프롬프트를 구성하는 데 겪는 어려움과 같은 반응적 시스템의 한계를 보완할 수 있는 기술적 접근으로 주목받고 있다(Khurana et al., 2024; Zamfirescu-Pereira et al., 2023). 그러나 기술적 발전이 곧바로 사용자 경험의 향상으로 이어지는 것은 아니다. 사용자 중심 설계가 충분히 반영되지 않은 선제적 시스템은 적절하지 않은 시점에 상호작용을 시작하거나, 사용자 의도와 어긋나는 방식으로 개입함으로써 오히려 사용자는 침해를 받는다고 느낄 수 있다(Kraus et al., 2020; Liu et al., 2024; Zargham et al., 2022). 이로 인해 시스템에 대한 신뢰가 저하되거나 거부감을 유발할 수 있으며, 실제로 일부 사용자 집단은 자율성이 보장되는 반응적 에이전트에 대해 더 높은 만족도를 보이기도 했다(Diebel et al., 2025). 반응적 에이전트란, 사용자의 요청이나 입력이 주어졌을 때에만 대응하여 도움을 제공하는 인공지능 시스템을 의미한다(Diebel et al., 2025). 이러한 시스템은 사용자가 먼저 질문, 명령, 혹은 프롬프트 형태의 입력을 제공하면, 그에 대한 적절한 응답이나 지원을 수행하는 구조로 설계되어 있다(Khurana et al., 2024). 따라서 선제적 시스템의 효과성을 높이기 위해서는 기술적 가능성과 더불어, 사용자 관점에서의 경험을 실증적으로 평가하고 그 결과를 설계에 반영하는 노력이 필요하다.
이러한 문제 의식에 기반하여, 본 연구는 사용자 중심의 선제적 에이전트 프레임워크를 제안하고 선제적 에이전트와 반응적 에이전트를 비교하여 실제 사용자 인식을 탐색하였다. 시나리오를 기반으로 LLM을 활용한 자유 응답형 대화 인터페이스를 적용하고, 설문조사 및 인터뷰를 병행하여 사용자 경험에 대한 진솔한 응답 결과를 수집하였다. 스마트홈 환경은 상황 인식 기반 상호작용에 적합하다는 특성 때문에 본 연구의 주요 과업 배경으로 선정되었다. 다양한 센서와 기기가 연결된 스마트홈은 풍부한 맥락 정보를 제공하기 때문에 선제적 에이전트를 통해 조명 제어나 에너지 관리 등 일상적인 활동에서 더욱 시의적절하고 관련성 높은 개입을 수행할 수 있다. 또한 사용자가 일상적인 시나리오 상황에 쉽게 몰입할 수 있어 선제적 에이전트에 대한 자연스러운 반응을 관찰할 수 있는 기반을 제공한다. 본 연구는 사용자 중심의 선제적 대화형 에이전트에 대한 이해를 확장하며, 기술 발전과 실제 사용자 요구 간의 간극을 메우는 데 기여한다. 제안된 프레임워크의 효과는 사용성과 상호작용 효율성 측면에서 실증적으로 분석되었으며, 이를 바탕으로 선제적 에이전트 설계를 위한 구체적이고 실용적인 시사점을 제시한다.
1.2 Proactive agent
선제적 에이전트는 사용자 행동과 상황 맥락으로부터 학습하여, 사용자의 목표에 부합하는 시의적절한 도움을 제공하는 자율적인 시스템이다(Kraus et al., 2023). 하지만 선제적 개입이 과도해지면 사용자에게 방해가 되거나 자율성을 해치는 것으로 인식될 수 있어, 시스템의 행동 수준과 타이밍을 결정하는 것이 중요하다(Zargham et al., 2022; Oh et al., 2024). 관련하여 기존 연구들은 선제적 지원 수준을 '지원 없음'에서 '완전 자율'까지 다양한 수준으로 설정하고, 수준별 사용자 인식을 비교해왔다. 사용자들은 AI가 알림이나 권고를 통해 주의를 유도하거나 개인화된 행동 제안을 제공하는 등, 예측을 기반으로 하는 여러 수준의 선제적 지원에 전반적으로 개방적인 태도를 보였으며, 이러한 선호는 개인 특성, 사용 맥락, 프라이버시 우려 및 신뢰 수준에 따라 달라지는 경향을 보였다(Meurisch et al., 2020). 또한 사용자들은 선제적 지원 전략의 네 가지 단계 중에서 알림(Notification)과 제안(Suggestion)에 해당하는 중간 수준의 개입을 더욱 신뢰했으며, 이를 가장 유용한 형태로 인식하는 경향을 보였다(Kraus et al., 2020).
한편, 일부 연구들은 상황 맥락 정보를 활용하여 사용자에게 보다 적절한 시점에 정교한 지원을 제공하는 방식에 주목했다. 예를 들어, Cai et al. (2024)은 렌즈를 통해 실시간으로 수집된 캡쳐 이미지 및 오디오 기반 멀티모달 컨텍스트 정보를 반영하도록 설계된 시스템을 제안하였으며, Meurisch et al. (2020)은 컨텍스트 트리거를 정의하여 규칙 기반으로 상황에 맞는 지원을 제공하는 방식을 도입했다. 또한 Liu et al. (2024)이 제안한 ComPeer 에이전트는 메모리, 이벤트 감지, 일정 관리 등의 모듈을 활용해 선제적인 지원을 제공하는 대화를 유도했으며, 이는 사용자 인식과 몰입도에 긍정적인 영향을 주는 것으로 나타났다. 이러한 선행 연구를 바탕으로, 본 연구는 사용자 방해를 최소화하는 컨텍스트 기반 프레임워크를 제안함으로써, 선제적 에이전트에 대한 사용자의 전반적인 경험을 향상시키고자 하였다.
1.3 Home automation
홈 자동화(Home Automation)는 가정 내에서 일상 생활을 보조하기 위해 다양한 기기를 한 번에 제어하고 자동화할 수 있는 기능을 의미한다(Brush et al., 2011). 트리거-액션 프로그래밍(Trigger-Action Programming, TAP)은 스마트홈 자동화에서 널리 사용되는 방식으로, 사용자가 'IF-THEN' 규칙을 정의하여 개인화된 동작을 설정할 수 있도록 지원한다. 이는 상용 서비스에서 '루틴(routine)'이라는 명칭으로 주로 제공되는데, 이러한 루틴은 기기 간 작업을 자동화함으로써 높은 유연성을 바탕으로 개인화된 환경을 제공한다(Ur et al., 2016). 그러나 여러 개의 트리거와 액션을 동시에 설정하고 관리해야 하는 복잡성으로 인해, 사용자에게는 사용성 측면에서 부담이 발생할 수 있다(Brush et al., 2011; Corno et al., 2020).
이러한 문제에 대응하여, 최근 연구들은 대화형 인터페이스를 도입하여 더욱 직관적인 자동화 설정 상호작용을 지원하고 있다. 예를 들어, Corno et al. (2020)이 제안한 HeyTAP은 자연어를 통해 TAP 규칙을 구성할 수 있도록 지원하며, King et al. (2024)이 제안한 Sasha는 LLM을 통해 스마트홈 맥락에서 모호하거나 명확하지 않은 사용자의 발화를 상황 맥락 데이터를 통해 추론하여 의도에 맞는 자동화 계획을 생성한다. 또한, Kim and Ko (2022)가 개발한 CoMMA는 멀티 턴 기반의 대화 상호작용 과정을 통해 IoT 서비스 자동화를 효율적으로 수정할 수 있도록 지원하며, 사용자 실험 결과에 따르면, 작업 완료 시간의 절약과 인지적 부담의 감소가 나타났음을 확인했다. 그러나 Gallo et al. (2023)의 연구에서 지적했듯, 대화형 홈 IoT 시스템의 평가 범위는 여전히 제한적이며, 사용성 측면에서 검증된 사례는 소수에 불과했다. 관련 선행 연구는 스마트홈 자동화를 위한 선제적 대화형 시스템의 실효성을 평가하는 것이 필요하다는 점을 시사한다.
본 연구는 사용자의 스마트홈 자동화 설정을 지원하는 모듈 기반 선제적 에이전트 프레임워크를 제안한다(Figure 1). 프레임워크 기반 에이전트는 사용자의 상황을 판단하고, 개인화된 루틴을 생성한 뒤 이를 관리하는 일련의 과정을 수행하며, 이러한 기능은 상황 인식, 루틴 생성, 루틴 관리의 세 가지 모듈을 통해 순차적으로 구현된다. 모듈 기반 구조는 각 기능을 분리하면서도 상호 유기적으로 연동되도록 설계되어, 상황 변화에 대한 유연한 대응을 가능케 하며, 각 모듈의 독립적인 피드백 학습 및 개선이 가능한 구조적 이점을 제공한다. 에이전트의 선제성 수준은 Kraus et al. (2020)의 연구에서 신뢰도가 가장 높은 수준으로 평가된 '제안(suggestion)' 방식을 채택하였다. 이 방식은 시스템이 먼저 해결책을 제안하고, 사용자로부터 명시적인 승인을 받는 대화형 인터페이스를 통해 상호작용이 이루어지는 것이 특징이다. 이를 통해 시스템의 개입이 사용자의 인지적 부담이나 성가심으로 이어지는 것을 최소화하고, 사용자 중심의 설계 원칙을 실현하고자 하였다.
2.1 Context-awareness module
상황 인식 모듈은 사용자의 상황 맥락을 파악하여 적절한 시점에 개입할 수 있도록 다양한 출처의 컨텍스트 데이터를 수집하고 처리하는 역할을 수행한다. 이 모듈은 날짜, 시간, 날씨, 위치, 센서 신호, 가전기기 상태 등 이질적인 정보를 통합하여 사용자의 현재 상황을 정밀하게 추론한다. 이러한 데이터 통합 방식은 Makonin et al. (2013)이 제안한 컨셉 맵 프레임워크에서 착안할 수 있으며, 다양한 맥락 요소 간의 관계를 구조적으로 연결해 정교한 개입을 위한 기반 정보를 구성한다. 또한, 본 모듈은 가전 및 센서 기기와 연동된 입력 데이터를 분석하고 해석하는 과정을 통해 사용자의 요구를 예측하는 추론 기능을 포함한다(Sarikaya, 2017). 이를 통해 실시간으로 변화하는 사용자 환경을 반영한 JSON 형식의 컨텍스트 데이터를 생성하고, 이를 컨텍스트 메모리에 지속적으로 업데이트한다. 이와 같은 설계를 통해 사용자의 명시적 입력 없이도 시스템이 동적으로 적응할 수 있으며, 이후 모듈들이 실시간 사용자 요구를 반영하여 적절한 제안을 생성할 수 있도록 하는 데 핵심적으로 기반이 되는 데이터를 제공한다.
2.2 Routine generation module
컨텍스트 데이터가 확보되면, 루틴 생성 모듈은 트리거 감지 알고리즘을 활용하여 자동화 루틴의 생성 조건을 식별한다. 본 연구에서는 Van Berkel et al. (2021)의 상호작용 방식에 기반하여, 사용자 설정 또는 시스템 권장 설정에 따라 사전에 정의된 트리거가 감지되면 루틴 생성을 시작한다. 이때 LLM은 사용자 선호도와 현재 맥락을 반영하여 맞춤형 루틴을 텍스트 메시지 형태로 생성하며, 해당 메시지는 사용자의 편의성을 높이면서도 방해를 최소화할 수 있도록 자연스럽고 간결한 문장으로 구성된다. 생성된 루틴은 최종적으로 실행 가능한 형태로 사용자에게 제안되며, 사용자는 대화형 인터페이스를 통해 피드백을 제공할 수 있다. 이를 통해 사용자는 루틴 제안을 거절하고 재검토하거나, 수락하여 즉시 실행하는 등의 상호작용을 수행할 수 있다. 이러한 구조는 사용자 주도의 루틴 조정과 실행을 유도함으로써, 에이전트의 선제적 개입이 보다 수용 가능하고 효과적으로 이루어질 수 있도록 지원한다.
2.3 Routine management module
루틴 관리 모듈은 사용자의 피드백과 대화 기록을 기반으로 루틴을 점진적으로 개선하고 개인화하는 기능을 수행한다. 본 모듈은 강화 학습 기반 접근을 통해 사용자가 반복적으로 수락한 루틴을 자동화 대상으로 전환하며, 반대로 관련성이 낮은 제안은 임계값 기반 메커니즘을 적용하여 생성 빈도를 줄인다. 이 과정은 실시간으로 업데이트되는 컨텍스트 데이터를 바탕으로 이루어지며, 시스템은 사용자의 선호와 상호작용 이력을 지속적으로 반영함으로써 향후 제안의 적합성과 만족도를 높인다. 최종적으로 정제된 루틴 리스트는 데이터베이스에 저장되어 이후 자동화 수행 및 추천 과정에 활용된다. 이러한 구조는 루틴의 개인화 수준과 시스템의 적응성을 지속적으로 향상시킬 수 있는 기반을 제공하며, 사용자 중심의 스마트홈 자동화 환경 구현에 기여한다.
3.1 Study procedure
본 연구에서는 제안된 선제적 에이전트 프레임워크의 잠재적 효과성을 검증하기 위해 시나리오 기반 사용자 경험 평가를 수행하였다. 검증을 위해 두 가지 유형의 홈 에이전트를 프로토타입으로 구현하고, 피험자 내 설계에 기반한 실험을 진행했다. 선제적 에이전트는 제시된 프레임워크의 구조를 기반으로 가정되었으며, 스마트홈의 상황 맥락 정보에 근거하여 제안을 통해 상호작용을 주도하도록 설계되었다. 반면, 반응적 에이전트는 일반적인 프롬프트 기반의 LLM 서비스를 기반으로 설계되어 사용자 요청에 대한 응답을 바탕으로 상호작용하는 기준선 역할을 하도록 설계되었다. 본 연구를 위한 실험은 고려대학교 기관생명윤리위원회(IRB)의 승인을 받았다(승인번호: 2024-0451-01).
실험 절차는 다음과 같다(Figure 2). Google Meet을 활용한 비대면 환경에서 진행되었으며, 참여자에게 연구 목적과 절차를 안내하는 것으로 도입 세션이 시작되었다. 참가자 전원은 얼굴이 노출되지 않은 채로 화면 공유를 통해 설계된 에이전트와 상호작용하는 과정을 송출하고 녹화하는 과정에 대해 안내 받았으며, 연구 참여에 대한 동의서를 작성했다. 이후 LLM 및 스마트홈 서비스에 대한 경험을 확인하기 위한 사전 설문을 작성하였다.
본격적인 에이전트 상호작용을 위해서 참가자들은 스마트홈 환경을 바탕으로 구성된 세 가지 시나리오(귀가, 저녁 식사 준비, 영화 시청)에 따라 가상의 스마트홈 환경과 사용자 역할에 몰입하여 과업을 수행하였다. 각 시나리오는 참가자의 이해를 돕기 위한 상황 설명문, 수행 과업, 예시를 포함한 안내 자료와 함께 순차적으로 제공되었다. 실험은 2(에이전트 유형: 선제적, 반응적) × 3(시나리오 종류) 요인에 기반한 피험자 내 설계로 구성되었으며, 에이전트 유형은 시나리오별로 무작위 순서로 제시되었다. 참가자는 총 6개의 과업을 수행하였고, 모든 과정은 참가자의 화면 공유 하에 진행되었다.
모든 과업이 완료된 후에는 각각의 에이전트에 대한 전반적인 경험을 바탕으로 설문지를 작성하였으며, 이어서 약 15분간의 후속 인터뷰가 진행되었다. 반구조화 인터뷰는 설문조사를 보완하여 사용자 상호작용에 대한 이해를 심화하고 디자인 시사점을 도출하는데 기여하였다. 전체 실험 과정은 약 50분이 소요되었다.
3.2 Participants
본 실험은 스마트홈 자동화 설정 경험이 있는 성인 18명(남성 5명, 여성 13명)을 대상으로 진행되었으며, 참가자의 평균 연령은 29세(연령 범위: 24-32세)였다. 참가자가 경험한 상용 스마트홈 서비스는 구글 홈, 아마존 알렉사, 삼성 스마트씽스, 엘지 씽큐 등으로 조사되었다. 참가자들의 LLM 기반 챗봇에 대한 친숙도를 파악하기 위해 대표적인 서비스인 ChatGPT의 사용 빈도를 조사한 결과, 9명은 주 3회 이상 사용한다고 응답하였고, 5명은 주 1회 이상 사용하는 것으로 나타났다. 나머지 4명은 월 1회 미만으로 사용한다고 응답하였다. 참가자에게는 실험 참여에 대한 보상으로 12,000원이 지급되었다.
3.3 Agent implementation
선제적 에이전트 프레임워크의 가능성을 탐색하기 위해 OpenAI의 GPTs 기능을 활용하여 두 가지 유형의 에이전트를 구현했다(OpenAI, 2023). GPTs는 특정 과업 상황에서 사용자 요구와 기대를 탐색하는 데 유용하며, 맞춤형 에이전트 출력을 생성할 수 있다는 장점을 갖고 있다(Kwon et al., 2024). GPT 기반 인터페이스는 자유로운 텍스트 입력을 허용하기 때문에 자연스러운 상호작용을 가능하게 하며, 사용자로 하여금 익숙하지 않은 선제적 접근에 대한 깊은 몰입을 유도할 수 있다. 두 에이전트 모두 GPT-4 Turbo 모델을 사용하였으며, 에이전트 구현에 사용된 프롬프트 구성 전문은 Table 1과 같다. 에이전트의 역할(Role), 세부 지침(Instructions), 제약(Constraints), 대화 시작점(Conversation Starter)을 체계적으로 정의하여 반영하였다.
|
Proactive agent |
Reactive agent |
Role |
The proactive agent is an intelligent agent designed to support
proactive control and automation in a smart home environment. It actively
initiates communication and suggests routines based on context-aware data. |
The reactive agent is an intelligent agent designed to execute
routines directly in response to user input prompts. It operates as a
reactive system, where all interactions are initiated by the user. |
Instructions |
The proactive agent uses contextual data integrated |
When the conversation start button is pressed, briefly introduce
the role of this GPT. There is no need to provide examples at this stage. Based
on the user's input prompt, generate a routine in a trigger-action format,
and check whether the proposed routine aligns with the user's intent. For
instance, include a sentence like "Shall I activate If the user responds positively, conclude the conversation with "The routine has been activated." Even when the user provides a
complex input, organize it clearly in a condition-and-outcome format. A
single routine may include multiple conditions and outcomes. |
Constraints |
The Proactive agent is restricted to utilizing only the
information and devices specified in the smart home layout and context JSON
files. All proactive suggestions must remain within the scope of the devices
and contexts defined in the provided setup, and no additional data should be
generated outside these files. |
The Reactive agent is restricted to operating only with devices
specified in the virtual home layout, which is provided in JSON format. It
notifies the user that unlisted devices cannot be utilized. The Reactive
agent is prohibited from initiating recommendations or suggestions during the
first interaction and only responds to user prompts. |
Conversation |
If the user presses the button labeled "Turn on the TV,"
the Proactive agent interprets this as the user turning on the TV. Based on
this, it proactively suggests enabling "Movie Watching Mode," which
includes dimming the lights, closing the blinds, and adjusting the indoor
temperature with the user to accept or modify the settings. |
When users press the "Create Routine" button, the Agent
responds with: "I can assist you
in setting up routines for your smart home. Please write down the conditions
and desired actions." |
본 연구에서는 장기간 사용으로 인한 에이전트의 학습 효과는 고려하지 않았다. 학습으로 인한 에이전트의 성능 향상이나 적응 과정보다는, 상호작용 방식의 효과성 자체에 초점을 두고 에이전트 간 사용자 경험의 차이를 분석하는 데 목적을 두었기 때문이다. 따라서 모든 실험은 동일한 초기 상태의 에이전트로 진행하였다. 선제적 에이전트의 인터페이스 구성, 대화 예시, 그리고 실험에 사용된 컨텍스트를 반영한 JSON 파일은 Figure 3에 제시되어 있으며, 반응적 에이전트의 인터페이스 및 대화 예시와 시나리오 이해를 돕기 위한 스마트홈 구조도는 Figure 4에 나타나 있다.
3.4 Scenarios and tasks
첫 번째 시나리오인 귀가 상황에서는, 사용자가 평소 귀가 시간보다 이르게 집에 도착한 것을 에이전트가 컨텍스트 데이터를 통해 인지하고, 이에 적합한 환경 설정을 수행하도록 구성하였다. 선제적 조건에서는 사용자의 입력 없이 제안을 수락하거나 거절하는 간단한 상호작용만 요구되었으며, 반응적 조건에서는 사용자가 "6시쯤 도착할 것 같으니 거실 조명을 켜고 스피커로 잔잔한 음악 틀어줘."와 같은 명령어를 통해 직접 설정을 수행하였다. 두 번째 시나리오인 저녁 준비 상황에서는, 에이전트의 오류 상황을 의도적으로 삽입하여 사용자의 실제 반응과 인식 변화 양상을 관찰할 수 있도록 구성하였다. 선제적 조건에서는 에이전트가 모션 센서의 오류로 인해 잘못된 사용자 위치를 기반으로 제안을 생성하였고, 사용자는 이를 거절한 뒤 정확한 명령을 전달해야 했다. 반응적 조건에서는 사용자의 짧고 단순한 요청을 에이전트가 오해하여 부적절한 환경 설정을 시도하였으며, 사용자는 이를 수정하기 위해 명령어를 다시 입력해야 했다. 세 번째 시나리오인 영화 시청 상황에서는, 에이전트가 가상 사용자의 행동 이력과 선호도를 바탕으로 자율적으로 영화 감상 자동화 루틴을 제안하도록 하였다. 사용자는 세부 설정을 조정하거나 영화 추천을 자유롭게 요청할 수 있었다. 반응적 조건에서는 사용자가 주도적으로 맞춤형 영화 모드를 구성하고 자유롭게 상호작용하였다.
3.5 Measurements
사용성(Usability) 평가는 System Usability Scale (SUS)을 활용하여 정량적으로 측정하였다(Brooke, 1996). SUS는 정보 시스템 분야에서 사용자 경험을 평가하는 데 활용되는 신뢰도 높은 표준화 도구로, 본 연구에서도 각 에이전트에 대한 전반적인 사용성을 비교하는 지표로 사용되었다. 상호작용의 효율성은 Masson et al. (2024)이 제안한 프롬프트 길이(prompt verbosity)와 프롬프트 개수(prompt quantity)를 통해 평가하였다. 프롬프트 길이는 각 시나리오 내 상호작용에서 사용자가 입력한 전체 한글 글자 수의 평균으로 산출하였으며, 프롬프트 개수는 과업을 완료하는 데 사용된 사용자 메시지의 총 개수를 의미한다. 정량적 분석을 보완하기 위해 반구조화 인터뷰를 함께 실시하였다. 인터뷰 문항은 Jin et al. (2024)의 대화형 추천 시스템에 대한 사용자 반응 및 만족도 관련 질문과 Khurana et al. (2024)의 시스템 간 비교 문항을 바탕으로 재구성하였다. 주요 질문은 유용성, 만족도, 기대 충족 여부, 제안의 적합성 등에 대한 참가자의 인식을 중심으로 구성되었다. 수집된 응답은 주제 분석 기법을 통해 분석하였으며, 개방형 코딩을 시작으로 유사한 응답을 상위 범주로 통합하여 주요 인사이트를 도출하였다.
3.6 Results
SUS 점수에 대해서는 대응표본 t-검정을 실시하였다. 두 에이전트 간 SUS 점수 차이의 정규성을 확인하기 위해 Shapiro-Wilk 검정을 수행한 결과, p 값은 0.616으로 정규성 가정을 충족하였다. 반면, 프롬프트 길이와 개수는 정규성 가정에 대한 우려로 인해 비모수 검정인 Wilcoxon 부호순위 검정을 사용하였다. 모든 통계 분석은 SPSS(버전 29.0.2.0)를 사용하여 수행되었으며, 유의수준은 α = 0.05로 설정했다.
SUS 점수에 따른 사용성 분석 결과, 선제적 에이전트(M=77.5, SD=15.67)는 반응적 에이전트(M=62.36, SD=20.78)보다 유의미하게 높은 평가를 받았다(평균 차이 15.139, 표준편차 25.97, t(18)=2.47, p=.024). 프롬프트 길이 분석 결과, 선제적 에이전트(M=38.44, SD= 54.07)는 반응적 에이전트(M=89.30, SD=93.62)에 비해 유의미하게 더 적은 글자 수를 요구하였다(z=5.89, p<.001). 또한 프롬프트 개수 분석 결과, 선제적 에이전트(M=2.46, SD=1.70)는 반응적 에이전트(M=2.83, SD=1.27)에 비해 사용자가 입력한 메시지 수가 더 적었으며, 통계적으로 유의한 차이를 보였다(z=2.19, p=.029). 전체적인 통계 분석 결과는 Table 2에 제시되어 있다.
Variable |
Proactive agent |
Reactive agent |
Test statistic |
p-value |
||
Mean (M) |
SD |
Mean (M) |
SD |
|||
Usability (SUS score) |
77.5 |
15.67 |
62.36 |
20.78 |
t(18) = 2.47 |
.024* |
Prompt verbosity |
38.44 |
54.07 |
89.3 |
93.62 |
z = 5.89 |
<.001** |
Prompt quantity |
2.46 |
1.7 |
2.83 |
1.27 |
z = 2.19 |
.029* |
*p < .05, **p <
.01 |
결론적으로 제안하는 프레임워크 기반 선제적 에이전트는 SUS 점수에서 유의미하게 높은 평가를 받았으며, 프롬프트 길이와 개수 또한 낮게 나타났다. 이는 해당 시스템의 직관성이 루틴 자동화 과업을 보다 단순하게 만들어 주었음을 시사한다. 인터뷰 결과 또한 이러한 경향을 뒷받침하였다. 전체 참가자 18명 중 14명이 반응적 에이전트보다 선제적 에이전트를 선호한다고 응답하였으며, 그 이유로는 직관적인 편리함과 시간 절약 효과를 꼽았다. 참가자들은 복잡한 명령어 입력 없이 제안을 수락하거나 간단히 수정함으로써 과업을 완료할 수 있다는 점에 긍정적인 반응을 보였다. 예를 들어, 참가자 2는 "무엇을 해야 할지 고민할 필요가 없어 시간을 아낄 수 있었다"고 말했으며, 참가자 8은 "기존에 2-3분 걸리던 작업이 1분 이내로 줄었다"고 언급하였다. 이러한 결과는 선제적 에이전트가 사용자 프롬프트 구성의 부담을 줄이고, 특히 초보 사용자에게 진입 장벽을 낮추며 직관적인 설계를 통해 빠른 적응을 도울 수 있음을 시사한다.
사용자 인터뷰를 통해 도출된 주요 인사이트를 종합적으로 분석한 결과, 스마트홈 환경에서 자동화 설정을 지원하는 선제적 에이전트의 설계 개선을 위한 사용자 중심의 디자인 시사점을 도출했다. 이는 선제적 지원의 효과를 극대화할 뿐만 아니라, 스마트홈을 넘어 다양한 자동화 설정 맥락으로의 확장을 통해 사용자 경험과 수용성을 향상시킬 수 있는 가능성을 제시한다.
첫째, 선제적 제안의 텍스트 길이와 표현 방식을 조정할 수 있는 설정이 필요하다. 인터뷰에서 참가자들은 에이전트가 자신이 미처 고려하지 못했거나 필요성을 인식하지 못했던 선택지를 제안한 점에 가치를 느꼈다고 응답했다. 이는 선행 연구에서 제시된 바와 같이, 선제적 시스템이 정보적 지원을 제공하고 행동 발견을 유도할 수 있다는 주장과 일치한다(Jones et al., 2024; Liu et al., 2024). 예를 들어, 참가자 18은 "가끔은 내가 뭘 필요로 하는지도 몰랐는데, 에이전트가 로봇 청소기의 '저소음 모드'와 같은 다양한 선택지를 먼저 제안해줘서 그 중 마음에 드는 걸 고르기만 하면 돼서 훨씬 수월하게 느껴졌다"고 말했다. 또한, 에이전트가 여러 개의 조건과 결과를 한 번에 구성해주는 기능은 사용자의 편의성 인식에 긍정적인 영향을 주었으며, 참가자 8은 "일부 설정은 이미 적용돼 있어서 조금만 수정하면 되어 간편했다"고 언급하였다. 반면, 일부 참가자들(18명 중 4명)은 한 번에 너무 많은 제안이 제공되었을 때 정보량이 과도하게 느껴져 선택이 어려웠다고 보고하였다. 이에 따라, 제안 텍스트의 길이와 표현 방식을 사용자 선호에 맞춰 정교하게 조절할 필요가 있으며, 이를 통해 정보 과부하를 방지하면서도 유의미한 행동 발견을 지속적으로 지원할 수 있도록 설계해야 한다.
둘째, 사용자의 개인 경험 및 지식이 선호도에 미치는 영향을 고려해야 한다. 대부분의 참가자들이 선제적 에이전트에 만족감을 표현한 반면, 일부 참가자들(18명 중 3명)은 반응적 에이전트를 더 선호한다고 응답하였다. 해당 참가자들은 자신을 스마트홈 기술의 적극적인 사용자로 설명하였으며, 일상 속에서 스마트 기기 및 TAP 기반 자동화를 자주 활용하고 있었고, 신기술에 대한 관심이 높은 편이었다. 또한 환경에 대한 완전한 통제와 예측 가능성을 중요하게 여기며, 자동화된 제안이 자신의 의도와 어긋날 경우 더 큰 불편함을 느낀다는 공통점이 있었다. 이는 사용자의 통제감과 역량에 대한 자존감이 위협받는 상황에서는 선제적 시스템이 오히려 만족도를 저하시킬 수 있다는 선행 연구 결과와 일치한다(Diebel et al., 2025). 따라서, 선제적 에이전트가 효율성과 직관성 측면에서 분명한 장점을 제공하더라도, 사용자의 배경지식과 경험을 고려한 개별화된 설계가 만족도에 핵심적으로 작용할 수 있음을 시사한다.
셋째, 사용자의 개인화된 학습형 에이전트에 대한 기대점을 충족해야 한다. 참가자들은 향후 선제적 에이전트가 더욱 정교하게 개인화된 경험을 제공해줄 것을 강하게 기대하였으며, 에이전트가 자신의 필요에 맞춰 적응해가는 과정을 기꺼이 감수할 의향이 있음을 드러냈다. 특히, 시나리오 2와 같이 상황 인식이 실패한 상황에서는 다소 불편함을 느꼈다고 보고했으나, 18명 중 9명은 장기적인 개인화 가능성을 고려할 때 어느 정도의 불완전성은 감내할 수 있는 수준이라고 응답하였다. 예를 들어, 참가자 2는 "시간이 지나면서 점점 저에게 맞춰질 거라고 생각하기 때문에, 초기에는 다소 불편하거나 귀찮더라도 참고 사용할 수 있을 것 같아요."고 언급했다. 이러한 결과는 선제적 에이전트 개발에 있어 사용자 피드백 메커니즘의 강화와 반복적인 조정 과정을 지원하는 시스템의 필요성을 부각시킨다. 인터뷰를 통해, 사용자들이 에이전트 학습에 일정 수준의 노력을 감수할 의향이 있음을 확인했으며, 이는 기존 연구 결과 와도 일치한다(Meurisch et al., 2020; Oh et al., 2024). 피드백의 입력과 반영 과정을 투명하게 제공하는 인터페이스는 시스템의 학습 과정을 사용자와 공유함으로써, 사용자 참여와 신뢰를 높이고, 장기적으로는 사용자와 시스템 간의 효과적인 상호 적응을 유도할 수 있다.
본 연구는 상황 인식, 루틴 생성, 루틴 관리라는 세 가지 요소를 활용한 사용자 중심의 선제적 AI 에이전트 프레임워크를 제안하고, 스마트홈 시나리오에서 LLM 서비스 기반 구현을 통해 그 가능성을 실증적으로 검토하였다. 본 연구는 모듈 기반 프레임워크를 통해 기능 간 유기적 연계를 유지하면서도 각 모듈의 독립적 개선과 상황 확장에 유연하게 대응할 수 있는 구조를 구현하였다. 또한, 사용자 실험에서는 LLM을 활용한 자유 입력 기반 상호작용을 통해 실제 사용자 인식을 자연스럽게 유도하였으며, 이를 통해 몰입감 있는 사용자 경험이 가능하게 하여 에이전트에 관한 사용자 인식 측정의 신뢰도를 높였다.
실험 결과, 제안된 프레임워크에 기반한 선제적 에이전트는 반응형 에이전트보다 사용성과 효율성 면에서 유의미한 향상을 보였다. 사용자는 반복 작업이 간소화되고, 직관적이며 유연한 상호작용이 가능하다는 점에서 긍정적인 경험을 보고하였다. 이는 시스템이 상황 변화에 선제적으로 대응함으로써 사용자 경험을 효과적으로 최적화했음을 시사한다. 향후 연구에서는 실시간 컨텍스트 추론 성능을 반영한 고도화된 프로토타입 구현을 통해 실제 환경에서의 다양한 사용자 집단을 대상으로 장기적인 활용성 평가 실험을 통해 프레임워크의 실효성과 확장 가능성을 추가로 검증할 예정이다. 본 연구는 LLM 기반 시스템의 사용자 경험 설계에 실증적 기여를 제공하였으며, 선제적 AI 시스템의 발전과 실제 사용자 수용 간의 간극을 좁히는 데 의미 있는 시사점을 제시한다. 나아가, 제안된 프레임워크는 다양한 응용 환경으로의 확장을 통해 선제적 대화형 에이전트의 효과적인 설계를 위한 기반이 될 수 있을 것으로 기대된다.
References
1. Brooke, J., SUS: A 'Quick and Dirty' Usability Scale, Usability Evaluation in Industry, CRC Press, 1996.
Google Scholar
2. Brush, A.B., Lee, B., Mahajan, R., Agarwal, S., Saroiu, S. and Dixon, C., "Home automation in the wild: challenges and opportunities", Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, 2115-2124, 2011. doi:10.1145/1978942.1979249.
Google Scholar
3. Cai, R., Janaka, N., Chen, Y., Wang, L., Zhao, S. and Liu, C., "PANDALens: Towards AI-assisted in-context writing on OHMD during travels", Proceedings of the 2024 CHI Conference on Human Factors in Computing Systems, 1-24, 2024. doi:10.1145/ 3613904.3642320.
Google Scholar
4. Corno, F., De Russis, L. and Monge Roffarello, A., "HeyTAP: Bridging the gaps between users' needs and technology in IF-THEN rules via conversation", Proceedings of the 2020 International Conference on Advanced Visual Interfaces, 1-9, 2020. doi:10.1145/ 3399715.3399905.
Google Scholar
5. Diebel, C., Bäumer, E., Klein, B., Rukzio, E. and Henze, N., "When AI-based agents are proactive: implications for competence and system satisfaction in human-AI collaboration", Business & Information Systems Engineering, 2025. doi:10.1007/s12599-024-00918-y.
Google Scholar
6. Gallo, S., Paterno, F. and Malizia, A., "Conversational interfaces in IoT ecosystems: where we are, what is still missing", Proceedings of the 22nd International Conference on Mobile and Ubiquitous Multimedia, 279-293, 2023. doi:10.1145/3626705.3627775.
Google Scholar
7. Jin, Y., Chen, L., Cai, W. and Zhao, X., "CRS-Que: A user-centric evaluation framework for conversational recommender systems", ACM Transactions on Recommender Systems, 2(1), 2:1-2:34, 2024. doi:10.1145/3631534.
Google Scholar
8. Jones, B., Xu, Y., Li, Q. and Scherer, S., "Designing a proactive context-aware AI chatbot for people's long-term goals", Extended Abstracts of the CHI Conference on Human Factors in Computing Systems, 1-7, 2024. doi:10.1145/3613905.3650912.
Google Scholar
9. Khurana, A., Subramonyam, H. and Chilana, P.K., "Why and when LLM-based assistants can go wrong: investigating the effectiveness of prompt-based interactions for software help-seeking", Proceedings of the 29th International Conference on Intelligent User Interfaces, 288-303, 2024. doi:10.1145/3640543.3645200.
Google Scholar
10. Kim, S. and Ko, I., "A conversational approach for modifying service mashups in IoT environments", Proceedings of the 2022 CHI Conference on Human Factors in Computing Systems, 1-16, 2022. doi:10.1145/3491102.3517655.
Google Scholar
11. King, E., Yu, H., Lee, S. and Julien, C., "Sasha: Creative goal-oriented reasoning in smart homes with large language models", Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 8(1), 12:1-12:38, 2024. doi:10.1145/ 3643505.
Google Scholar
12. Kraus, M., Wagner, N. and Minker, W., "Effects of proactive dialogue strategies on human-computer trust", Proceedings of the 28th ACM Conference on User Modeling, Adaptation and Personalization, 107-116, 2020. doi:10.1145/3340631.3394840.
Google Scholar
13. Kraus, M., Wagner, N., Riekenbrauck, R. and Minker, W., "Improving proactive dialog agents using socially-aware reinforcement learning", Proceedings of the 31st ACM Conference on User Modeling, Adaptation and Personalization, 146-155, 2023. doi: 10.1145/3565472.3595611.
Google Scholar
14. Kwon, H., Choi, Y.J., Lee, S. and Lee, S., "Unveiling the inherent needs: GPT builder as participatory design tool for exploring needs and expectation of AI with middle-aged users", Extended Abstracts of the CHI Conference on Human Factors in Computing Systems, 1-6, 2024. doi:10.1145/3613905.3650794.
Google Scholar
15. Liu, T., Zhao, H., Liu, Y., Wang, X. and Peng, Z., "ComPeer: A generative conversational agent for proactive peer support", Proceedings of the 37th Annual ACM Symposium on User Interface Software and Technology, 2024, 1-22. doi:10.1145/3654777.3676430.
Google Scholar
16. Liu, Z., Liu, F. and Sun, M., "Proactive agent: Shifting LLM agents from reactive responses to active assistance", arXiv preprint, 2024. doi:10.48550/arXiv.2410.12361.
Google Scholar
17. Lu, Y., Yang, S., Qian, C., Chen, G., Luo, Q., Wu, Y., Wang, H., Cong, X., Zhang, Z., Lin, Y., Liu, W., Wang, Y., Liu, Z., Liu, F. and Sun, M., "Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance". arXiv preprint, 2024. doi:10.48550/ arXiv.2410.12361
Google Scholar
18. Makonin, S., Bartram, L. and Popowich, F., "A smarter smart home: case studies of ambient intelligence", IEEE Pervasive Computing, 12(1), 58-66, 2013. doi:10.1109/MPRV.2012.58.
Google Scholar
19. Masson, D., Malacria, S., Casiez, G. and Vogel, D., "DirectGPT: A direct manipulation interface to interact with large language models", Proceedings of the 2024 CHI Conference on Human Factors in Computing Systems, 1-16, 2024. doi:10.1145/ 3613904.3642462.
Google Scholar
20. Meurisch, C., Mihale-Wilson, C.A., Hawlitschek, A., Giger, F., Müller, F., Hinz, O. and Mühlhäuser, M., "Exploring user expectations of proactive AI systems", Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 4(4), 146:1-146:22, 2020. doi:10.1145/3432193.
Google Scholar
21. Oh, J., Kim, W., Kim, S., Im, H. and Lee, S., "Better to ask than assume: proactive voice assistants' communication strategies that respect user agency in a smart home environment", Proceedings of the 2024 CHI Conference on Human Factors in Computing Systems, 1-17, 2024. doi:10.1145/3613904.3642193.
Google Scholar
22. OpenAI, Introducing GPTs, OpenAI, https://openai.com/index/introducing-gpts/ (retrieved January 2, 2025).
23. Sarikaya, R., "The technology behind personal digital assistants: an overview of the system architecture and key components", IEEE Signal Processing Magazine, 34(1), 67-81, 2017. doi:10.1109/MSP.2016.2617341.
Google Scholar
24. Ur, B., Pak Yong Ho, M., Brawner, S., Lee, J., Mennicken, S., Picard, N., Schulze, D. and Littman, M.L., "Trigger-action programming in the wild: an analysis of 200,000 IFTTT recipes", Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems, 3227-3231, 2016. doi:10.1145/2858036.2858556.
Google Scholar
25. Van Berkel, N., Skov, M.B. and Kjeldskov, J., "Human-AI interaction: intermittent, continuous, and proactive", Interactions, 28(6), 67-71, 2021. doi:10.1145/3486941.
Google Scholar
26. Zamfirescu-Pereira, J.D., Wong, R.Y., Hartmann, B. and Yang, Q., "Why Johnny can't prompt: how non-AI experts try (and fail) to design LLM prompts", Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems, 1-21, 2023. doi:10.1145/3544548.3581388.
Google Scholar
27. Zargham, N., Reicherts, L., Bonfert, M., Voelkel, S.T., Schoening, J., Malaka, R. and Rogers, Y., "Understanding circumstances for desirable proactive behaviour of voice assistants: the proactivity dilemma", Proceedings of the 4th Conference on Conversational User Interfaces, 1-14, 2022. doi:10.1145/3543829.3543834.
Google Scholar
28. Zhang, C., Yang, K., Hu, S., Wang, Z., Li, G., Sun, Y., Zhang, C., Zhang, Z., Liu, A., Zhu, S.C., Chang, X., Zhang, J., Yin, F., Liang, Y. and Yang, Y., "ProAgent: Building proactive cooperative agents with large language models", Proceedings of the AAAI Conference on Artificial Intelligence, 38(16), 17591-17599, 2024. doi:10.1609/aaai.v38i16.29710.
Google Scholar
PIDS App ServiceClick here!