Skip to main content
QUICK REVIEW

[논문 리뷰] Capacitated Team Formation Problem on Social Networks

Samik Datta, Anirban Majumder|arXiv (Cornell University)|2012. 05. 16.
Mobile Crowdsensing and Crowdsourcing참고 문헌 13인용 수 72
한 줄 요약

이 논문은 사회적 네트워크에서 팀을 구성할 때 개인 사용자의 용량 제약을 고려하면서도 사회적 협업 비용을 최소화하는 새로운 용량 제약이 있는 팀 구성 문제를 제안한다. 저자들은 실세계의 GitHub 및 DBLP 데이터셋에서 기준 방법 대비 20–40% 향상을 달성하는 효율적인 근사 알고리즘(MinDiamSol 및 MinAggrSol)을 설계하였으며, 사회적으로 유대감이 강하고 균형 잡힌 팀을 구성하는 데 있어 뛰어난 확장성과 효과성을 입증한다.

ABSTRACT

In a team formation problem, one is required to find a group of users that can match the requirements of a collaborative task. Example of such collaborative tasks abound, ranging from software product development to various participatory sensing tasks in knowledge creation. Due to the nature of the task, team members are often required to work on a co-operative basis. Previous studies have indicated that co-operation becomes effective in presence of social connections. Therefore, effective team selection requires the team members to be socially close as well as a division of the task among team members so that no user is overloaded by the assignment. In this work, we investigate how such teams can be formed on a social network. Since our team formation problems are proven to be NP-hard, we design efficient approximate algorithms for finding near optimum teams with provable guarantees. As traditional data-sets from on-line social networks (e.g. Twitter, Facebook etc) typically do not contain instances of large scale collaboration, we have crawled millions of software repositories spanning a period of four years and hundreds of thousands of developers from GitHub, a popular open-source social coding network. We perform large scale experiments on this data-set to evaluate the accuracy and efficiency of our algorithms. Experimental results suggest that our algorithms achieve significant improvement in finding effective teams, as compared to naive strategies and scale well with the size of the data. Finally, we provide a validation of our techniques by comparing with existing software teams in GitHub.

연구 동기 및 목표

  • 팀원들이 사회적으로 연결되어 있어야 하며, 개별 사용자가 과도하게 부담을 지지 않도록 효과적인 협업 팀을 구성하는 데 도전하는 것.
  • 기존 운영 연구 및 사회적 네트워크 기반 팀 구성 연구에서 간과된 핵심 제약인 용량 제약 하에서 팀 구성 문제를 모델링하고 해결하는 것.
  • 대규모 사회적 네트워크에서 사용 가능한 성능 보장을 갖춘 효율적인 근사 알고리즘을 설계하는 것.
  • GitHub 및 DBLP의 실세계 데이터를 사용하여 기존 소프트웨어 팀과의 비교를 통해 접근 방식을 검증하는 것.

제안 방법

  • 사용자를 노드로, 공동 저자 관계 또는 협업 빈도에 기반한 가중치가 부여된 간선으로 구성된 그래프 최적화 문제로 용량 제약이 있는 팀 구성 문제를 수식화한다.
  • 두 가지 사회적 협업 비용 모델을 정의한다: 직경 기반(MinDiamSol)과 집계 기반(MinAggrSol)이며, 모두 용량 제약 하에서 총 사회적 비용을 최소화한다.
  • 기본으로 그린 휴리스틱을 사용하고, MinDiamSol 및 MinAggrSol과 비교하며, 용량 제한을 준수하면서 비용을 최소화하는 방식으로 사용자를 반복적으로 선택한다.
  • 공동 프로젝트 또는 논문을 기반으로 사용자 간의 사회적 밀접함을 추정하기 위해 자카르 유사도를 적용한다.
  • GitHub(4년간의 오픈소스 개발 데이터)와 DBLP(학술 공동저자 네트워크)의 두 실세계 데이터셋에 알고리즘을 구현하고 평가한다.
  • 다양한 작업 크기와 네트워크 밀도에서의 확장성과 성능을 테스트하기 위해 합성 작업 생성을 적용한다.

실험 결과

연구 질문

  • RQ1어떻게 하면 팀원들이 사회적으로 유대감이 있으며, 개별 사용자가 용량을 초과하지 않도록 사회적 네트워크에서 팀을 구성할 수 있는가?
  • RQ2용량 제약이 팀 구성 품질과 알고리즘 효율성에 어떤 영향을 미치는가?
  • RQ3용량 제약이 있는 팀 구성에 대한 근사 알고리즘과 단순 휴리스틱 방법 간의 사회적 비용과 확장성 측면에서의 성능 비교는 어떠한가?
  • RQ4제안된 알고리즘이 GitHub의 실제 소프트웨어 팀과 유사한 팀을 효과적으로 식별할 수 있는가?
  • RQ5다른 사회적 협업 비용 모델(직경 대비 집계)이 팀 품질과 계산 성능에 어떤 영향을 미치는가?

주요 결과

  • 제안된 MinDiamSol 및 MinAggrSol 알고리즘은 GitHub 데이터셋에서 기준 휴리스틱 대비 약 20% 향상된 팀 비용을 달성한다.
  • 더 높은 밀도를 보이는 DBLP 데이터셋에서는 사용자 용량과 네트워크 밀도가 높아 약간 감소한 20% 내외의 향상이 관찰된다.
  • 네트워크 크기에 비례하여 잘 확장되며, 수십만 명의 사용자까지도 효율적으로 처리할 수 있다.
  • 모든 작업 크기에서 연결되지 않은 팀(즉, 구성원 간 사회적 연결이 없는 팀)의 비율은 낮게 유지되어 강한 팀 유대감을 나타낸다.
  • 예를 들어 Lappas 등이 제안한 기존 방법의 자연스러운 확장보다도 크게 뛰어난 성능을 보이며, 특히 부하 균형 조절과 사회적 비용 최소화 측면에서 뛰어나다.
  • 실제 GitHub 팀과의 검증을 통해 알고리즘으로 선택된 팀은 사회적으로 유대감이 강하고 실제 개발 팀과 유사한 구조적 특성을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.