책소개
저자가 처음으로 사회 연결망 분석을 연구할 때인 1980년대만 해도 국내에는 이에 대한 관심이 거의 없었다. 아동학이나 가족 연구, 사회복지학을 공부하는 학생들이 분석 방법에 대해 가끔 문의하는 정도였다. 1990년에 용기를 내어 처음으로 개설한 대학원 강의에는 수강생 3명과 각지에서 온 청강생 5명이 수업을 들었다. 그러나 이제는 사정이 많이 달라져 연결망 분석 강의가 제법 인기 과목의 반열에 들게 되었다.
개정3판을 낸 지 5년 만에 다시 4판을 내게 되었다. 이 기간 동안에 네트워크 분석 방법은 빠르게 발전하면서 각종 분석프로그램들이 업데이트되고 개정판에 대한 요구가 계속 있어 왔다. 동시에 이 분석 기법은 여러 학문 분야에 빠른 속도로 전파되어, 이제는 거의 대부분의 사회과학 분야와 물리학이나 생물학 등 자연과학 분야, 그리고 의학을 포함한 생명과학 분야에서 점점 더 자주 만날 수 있게 되었다. 테러리스트 네트워크 분석, 축구 선수들 사이의 패스 네트워크, 혹은 소설 <토지>의 등장인물 사이의 네트워크, 유전자 발현 네트워크나 신약 개발을 위한 단백질 네트워크 분석 등 새로운 학문 융합 분야에서도 네트워크 분석을 쉽게 발견할 수 있게 된 것이다. SNS의 확산 등 정보의 축적과 컴퓨터 연산능력의 발달로 인해서 이제 웹에 있는 모든 단어들의 관계까지 분석 대상이 되어 사람들의 행태를 분석하는 시대이다.
사회학 내에서는 경제사회학이라는 분야가 번성하면서 경제적 행위는 행위자가 어떤 사회 관계망에 놓여 있는가에 따라 달라지며, 시장은 자유시장(free market)이 아니라 구조화되어 있고, 시장 구조를 분석하려면 연결망 분석이 좋은 도구라는 것을 깨닫게 되었다. 정치학 분야에서는 정책 결정 과정에 연결망이 작용한다는 현상을 연구하기 시작했으며, 사회복지학 분야에서는 사람들 사이의 ‘도움 연결망(helping network)’이나 ‘지원 연결망(support network)’이 인간의 복지에 중요하다는 것을 알게 되었다. 보건 분야에서는 연결망과 건강 사이의 연구 결과가 쏟아져 나오고 있다. 가령, 비만도 사회연결망에 의해서 전염되며, 행복감이나 건강도 연결망에 의해서 전파된다는 것이다. 경영학 분야에서도 사람들과의 ‘좋은 관계 맺기’가 기업의 경영 성과뿐만 아니라 각 개인들의 업무 성과에도 큰 영향을 미친다는 것을 발견하였다. 이처럼 연결망의 중요성이 모든 사회과학 전 분야에서 인식되면서 연결망 분석 기법에 대한 관심도 상당히 커진 편이다.
연결망 분석이 이렇게 확산되는 데는 크게 두 가지 이유가 있다. 첫째는 과학이 발전함에 따라 여러 차원 사이의 인과성에 대한 관심이 증대되어 가고 있기 때문이다. 쉬운 예를 들면, 왕따가 겪는 심리적 고통과 행동의 특이성은 개인보다 한 차원 높은 네트워크의 특성에서 유발된다. 갑자기 뜨는 현상들은 (예를 들면, 지진이나 눈사태, 또는 대박을 터뜨린 영화) 미시적인 단위들 사이의 네트워크에 의해서 생겨난다. 복잡계 과학이나 네트워크의 과학은 바로 이러한 여러 차원 사이의 관계성에 의해서 창발하는 현상에 대한 관심이라고 볼 수 있으며, 이것이 네트워크 분석이 확산되는 원인이다. 두 번째 이유는 정보 사회가 도래함에 따라 전자적 정보의 축적이 방대해졌기 때문이다. 이메일 발송 네트워크, 휴대전화 통화 네트워크, 트위터나 페이스북의 SNS 등을 활용해, 필요하다면 비교적 쉽게 가공하여 사람들 사이의 네트워크를 분석할 수 있는 세상이 온 것이다. 뿐만 아니라 이전에는 전혀 접근할 수 없었던 유전자 네트워크 등 복잡계 현상과 관련된 자료가 쌓이고 있다. 블로그에 수많은 문장들을 활용하여, 단어와 단어 사이의 네트워크를 분석할 수도 있게 되었다. 가령, 사람들이 막걸리를 언급할 때, 가장 많이 언급하는 다른 단어는 무엇인지를 알아낼 수 있다. 파전이라는 단어가 막걸리와 동시 출현 빈도가 가장 높다면, 막걸리 회사 주식 가격이 오를 때 파전의 원료인 밀가루 생산 회사의 주식도 함께 오를 것이라고 추측할 수 있게 된 것이다.
저자는 네트워크 분석을 하기 위해서 가장 좋은 프로그램은 무엇이냐는 질문을 종종 접한다. 대답은 그러나 불행하게도 그런 프로그램은 잘라 말해서 ‘없다’. 사회 연결망 분석을 위해 개발된 무수한 기법은 “정글에 뿌려진 갖가지 씨앗들”처럼 각각의 나무들이 곳곳에서 무성하게 자라난 상태로서, 네트워크 분석용 프로그램들은 각기 다른 특징을 갖고 있으며 계산해 주는 지표도 약간씩 서로 다르다. 또한 강의와 연구 지도 경험을 돌이켜보면 학생마다 쉽게 이해하고 다루는 프로그램들이 달랐다. 결국 일반 통계학 패키지인 SAS나 SPSS처럼 표준화된 패키지 프로그램은 없는 실정이다.
저자가 이 책의 분석과정에서 다룬 프로그램들은 UCINET, 사이람(Cyram)에서 개발한 NetMiner, 그리고 SAS이다. 이 세 가지만 익히면 거의 대부분의 연결망 분석을 처리할 수 있을 것이다. 그리고 최근에 많은 활용이 이루어지고 있는 R과 Gephi에 대해서도 14장에서 간단히 소개하였다. 크랙플롯(KrackPlot)이라는 프로그램은 이 책의 초판에는 한 개의 독립된 장으로 소개되었지만, 도스용 프로그램이기 때문에 조잡한 그래픽 처리, 윈도우용 프로그램과 자료 교환이 어렵다는 등의 단점이 있어서 2판에서부터 삭제하였다. SPSS로 MDS를 다루던 장도 이번 판에서는 삭제하였다.
4판은 3판을 다음과 같은 내용으로 크게 수정했다.
분석 시 많이 활용되는 개념을 중심으로 장을 재구성하였다. 또한 가능하면 UCINET을 이용한 분석 방법을 소개하였다. UCINET를 이용하여 분석이 어려운 경우에 NetMiner와 SAS, Pajek을 이용한 분석을 소개하였다. 책의 구성을 바꾸면서 이전 판에서는 다루었지만, 개정판에서는 다루어지지 않은 부분들도 존재한다. 특히 국내에서 개발한 NetMiner를 활용한 분석 설명 부분이 많이 줄어든 것은 아쉽다. 하지만 NetMiner의 경우 한글 매뉴얼이 만들어져 배포되었고, 문의가 필요할 시에 사이람에 우리말로 전화 혹은 이메일로 문의하면 친절한 답변을 받을 수 있기 때문에 독자들이 비교적 수월하게 프로그램을 익힐 수 있을 것이라 판단하였다. 그리고 심화 학습을 위하여 참고문헌을 각 장별로 배치하였다.
이 책의 초판을 처음으로 집필하기 시작한 지가 벌써 20년이 넘었다는 사실에서 새삼 세월의 빠름을 느낀다. 기억을 되살려 보면, 이 책은 대학원에 개설했던 첫 번째 연결망 분석 강의를 수강했거나 청강했던 학생들의 도움을 받으면서 출발했었다. 박찬웅 교수와 이경용 박사, 이희제, 김명세, 차영주, 서남규 등이 초판 작업을 도와주었으며, 개정판 작업은 윤호영의 도움을 받았다. 3판은 김영진의 도움을 받았다. 4판은 3판 작업에서 도움을 주었던 김영진이 공저자로 참여하였다. 4판의 원고 교정에 있어서는 이상직, 김이선, 박윤중의 도움을 받았다. 연결망 분석은 다양한 학문에서 연구가 빠르게 발전하기 때문에 가까운 미래에 이 책의 내용들을 더욱 발전시키는 것이 필요할 것이다. 책의 부족한 부분은 전적으로 저자의 책임이다. 미흡한 부분을 발견했을 때 저자들에게 아낌없는 조언과 수정 방향에 대한 제시를 부탁한다. 지식 생태계는 열린 연결망이기 때문에 독자들의 참여가 한국의 사회 연결망 분석 생태계를 더욱 발전시키리라 생각한다.
끝으로 책을 예쁜 디자인과 함께 편집해 준 박영사의 편집진에게 감사의 뜻을 전한다.
2016년 8월
저 자
저자소개
미국 시카고대에서 사회학 박사학위를 받았으며, 연세대학교 제18대 총장을 역임했다. 현재 연세대학교 사회학과 명예교수, SK텔레콤 이사회 의장과 삼성생명 공익재단 이사로 재임 중이다. 사회 연결망 분석과 사회 연결망 이론을 연구했다. 대통령 자문 정책기획위원회, 교육부 대학설립위원회, 교육부 BK기획위원회 등에서 활동하였다. 주요 저서로는 《사회 연결망 분석》을 비롯하여 《경계 넘어 네트워킹하기》(2022), 《사회연결망 이론》(2010, 문화체육관광부 우수도서), 《네트워크 사회의 빛과 그늘》(2009), 《비교사회학》(2000) 등이 있다. American Journal of Sociology 부편집장과, Sage에서 출간하는 Rationality and Society 국제편집위원을 역임했다.
목차
"
제1장
연결망 분석이란?
1.1. 관계적 관점으로의 전환5
1.2. 연결망 분석의 발전9
1.3. 책의 구성10
1.4. UCINET13
제2장
연결망 연구 설계
2.1. 연구 설계에서 고려할 점19
2.2. 연결망 분석 단위22
2.3. 연결망 분석의 접근법26
제3장
연결망 자료
3.1. 인접 행렬 자료 36
3.2. 자아 중심 연결망37
3.3. 준연결망 자료(quasi network data)43
3.4. 행렬을 리스트로 표현하기45
3.5. 실습46
제4장
연결망 시각화 및 탐색
4.1. 연결망 시각화 기법의 발전65
4.2. 통계 방법의 적용68
4.3. 그래프 알고리즘74
4.4. 기타76
4.5. 연결망 시각화의 의의와 탐색77
4.6. 실습81
제5장
연결망의 구조적 특성
5.1. 응집성91
5.2. 연결성93
5.3. 노드의 이웃 관계95
5.4. 군집 계수(clustering coefficient)99
5.5. 실습101
제6장
중앙성
6.1. 중앙성의 주요 개념들119
6.2. 지역중앙성과 전체중앙성의 관계127
6.3. 기타 중앙성 지표129
6.4. 중심화(Centralization)132
제7장
집 단
7.1. 응집 정도와 연결 정도로 하위 집단을 구분해 내기140
7.2. 하위 집단을 파악하는 다양한 접근 방법143
7.3. 대규모 네트워크 자료에서의 집단 탐색144
7.4. 군집 분석(Clustering)149
제8장
지위와 역할
8.1. 구조적 등위성(等位性)161
8.2. 형태 등위성(Automorphic Equivalence)165
8.3. 역할 등위성(Role Equivalence)166
8.4. 실습168
제9장
이원 연결망 분석(2-mode network analysis)
9.1. 완전 연결망으로의 변환180
9.2. 대응 분석(Correspondence Analysis)185
9.3. 협업 필터링(Collaborative Filtering)187
9.4. 실습188
제10장
자아 중심 연결망 분석
10.1. 설문 자료에서 자아 중심 연결망 추출하기202
10.2. 자아 중심 응답 자료에서 상담 관계의 학력 간관계 도출하기205
10.3. 중재자 역할(Brokerage)208
10.4. 구조적 공백210
10.5. 실습214
제11장
SAS/IML을 이용한 자료 변환
11.1. 외부 파일을 SAS 파일로 변환하기229
11.2. SAS/IML 진입하기230
11.3. 행렬의 입력231
11.4. SAS/IML의 연산자(operator)232
11.5. IML에서 SAS 자료 불러오기와 내보내기243
11.6. DATA 처리 사례244
11.7. 서베이 자료에서 완전 연결망 만들기249
제12장
가설 세우고 검증하기
12.1. QAP258
12.2. ERGMs(Exponential Random Graph Models)261
제13장
텍스트에서 의미 관계 추출하기
13.1. KLT를 이용한 한글 형태소 분석270
13.2. EXCEL로 단어 목록 만들기273
13.3. 의미 관계 형성: SAS/IML로 연결망 행렬 만들기275
제14장
연결망 분석 프로그램 소개
14.1. NetMiner283
14.2. Pajek292
14.3. R308
14.4. Gephi311
14.5. 연결망 분석 프로그램 선택 시 고려 사항321
국문 색인323
영문 색인327
그림 차례
?그림 1-1? 구조의 효과 예시6
?그림 1-2? TouchGraph Application in Facebook7
?그림 1-3? SNS 트렌드 및 연관어 검색 서비스8
?그림 1-4? 한국에서의 연결망 연구 추이10
?그림 1-5? 책의 구성과 장별 연계12
?그림 1-6? UCINET 실행 화면14
?그림 2-1? 2011년 3월 웹 사이트 유입량 기준 상위 50개 사이트 간인터넷 교통망24
?그림 2-2? 관계적 접근과 위치적 접근의 차이27
?그림 3-1? 완전 연결망 행렬과 그래프37
?그림 3-2? 자아 중심 연결망의 예39
?그림 3-3? 준연결망 변환을 통해 얻은 아마존 서적 간의 n×n 연결망44
?그림 3-4? 행렬 편집기(Matrix Editor)46
?그림 3-5? 데이터 파일 불러오기47
?그림 3-6? ‘.##h’ 자료 열기52
?그림 3-7? Krack-High-Tec.##h(REPORTS_TO) 편집창53
?그림 3-8? DL Editor(Nodelist1 형식으로 입력하기)54
?그림 3-9? c기업의 비공식 연결망(21*21 행렬)55
?그림 4-1? 12-13세기 러시아의 교역 연결망 지도64
?그림 4-2? 모레노(Moreno)의 사회망66
?그림 4-3? 초창기 연결망 시각화 방법의 발전 양태67
?그림 4-4? 상관관계 요인 2차원 도표와 연결망 그래프68
?그림 4-5? 서울을 중심으로 그린 부산의 위치70
?그림 4-6? MDS 절차의 예시: 평면상 위치 선정 작업71
?그림 4-7? 도시 간 비행 거리에 근거한 다차원척도 2차원 지도72
?그림 4-8? 대표적인 Spring Layout 비교75
?그림 4-9? 환형 시각화 예시76
?그림 4-10? Layered Layout의 예: 공식 조직도77
?그림 4-11? 비공식적 조언 연결망78
?그림 4-12? 사무실 평면도와 접촉 연결망79
?그림 4-13? ?그림 4-11? ‘비공식 조언 연결망’ 3차원 그래프 예시80
?그림 4-14? NetDraw 실행 초기화면82
?그림 4-15? 자료 불러오기82
?그림 4-16? C기업의 비공식 연결망83
?그림 4-17? MDS로 표현하기84
?그림 4-18? 자아 중심 연결망 살펴보기85
?그림 5-1? 4개의 노드가 있을 경우 생길 수 있는 연결망의 형체와 개념92
?그림 5-2? 연결망 그래프 예시94
?그림 5-3? 2자 관계의 4가지 형태96
?그림 5-4? 가능한 모든 3자 관계의 집합97
?그림 5-5? 3자 관계의 일반화된 형태와 MAN 기호화98
?그림 5-6? 좁은 세상 연결망의 특징100
?그림 5-7? C기업의 비공식 연결망의 밀도 계산하기101
?그림 5-8? C기업의 비공식 연결망의 밀도 계산 결과102
?그림 5-9? 연결망의 경로 거리 구하기103
?그림 5-10? C기업 비공식 연결망의 경로 거리 행렬105
?그림 5-11? 노드 쌍 간의 최대 흐름106
?그림 5-12? 연결망의 2자 관계 유형 분석 결과107
?그림 5-13? 3기업 연결망의 3자 관계와 연결망 이전성108
?그림 5-14? C기업 연결망의 군집 계수109
?그림 6-1? C기업의 ‘비공식적’, ‘공식적’ 연결망119
?그림 6-2? C기업 비공식/공식 연결망의 노드들의 연결정도 중앙성120
?그림 6-3? C기업 비공식 연결망의 노드들의 인접중앙성 분석 결과122
?그림 6-4? C기업 비공식/공식 연결망의 노드들의 사이중앙성 분석 결과124
?그림 6-5? 다른 형태의 네트워크의 표준화된 사이중앙성 값 예시125
?그림 6-6? C기업 비공식 연결망 링크 사이중앙성 계산 결과126
?그림 6-7? 노드의 중앙성128
?그림 6-8? PageRank Centrality 동심원형 시각화 화면130
?그림 6-9? HITS Centrality Vector-Authority and Hub131
?그림 6-10? Community Centrality 산점도132
?그림 6-11? 집중화 정도가 높은 연결망의 예133
?그림 7-1? 결속 집단141
?그림 7-2? 중첩된 결속 집단141
?그림 7-3? 2중 구성 집단의 예143
?그림 7-4? Girvan-Newman Clustering 설정 창145
?그림 7-5? Girvan-Newman Clustering 분석 결과146
?그림 7-6? 연결망에서 집단 구분의 예147
?그림 7-7? Factions 메뉴에서 Modularity 설정148
?그림 7-8? Modularity 분석 결과149
?그림 7-9? 군집 분석에서 Similarities/Dissimilarities 측정 방법 선택151
?그림 7-10? 유사성 행렬에 대한 위계적 군집 분석152
?그림 7-11? Cluster analysis Dendrogram(유사성 군집 구조 분석 결과)153
?그림 8-1? ‘~~의 자녀’ 관계의 단순 모형159
?그림 8-2? 가상의 조직도160
?그림 8-3? 상관계수는 등위적이지만 유클리드 거리는비등위적인 경우 예시162
?그림 8-4? 구조적 등위성과 형태 등위성의 비교165
?그림 8-5? 가능한 모든 3자 관계의 집합166
?그림 8-6? 구조적 등위성 계산 설정 창168
?그림 8-7? 병원 내 행위자들의 구조적 등위성 군집170
?그림 8-8? 부족 간 결혼 교환관계의 블럭171
?그림 8-9? CONCOR를 이용한 블럭 분석창171
?그림 8-10? CONCOR의 절차172
?그림 9-1? 이원 행렬 자료의 시각화181
?그림 9-2? 대응 분석 결과(학위 연도와 학문 분야)186
?그림 9-3? DL Editor로 2-mode Edgelist 입력하기191
?그림 9-4? 키워드×논문(id) 2원 행렬192
?그림 9-5? NetDraw를 활용한 2-mode 연결망 시각화 결과193
?그림 9-6? 2-mode→1-mode 변환194
?그림 9-7? 2원 행렬의 1원 행렬 변환 결과194
?그림 9-8? 키워드 간의 연결망195
?그림 10-1? 응답자의 자아 중심 연결망204
?그림 10-2? 중재자 역할의 5가지 유형209
?그림 10-3? 제약성과 구조적 공백의 비교211
?그림 10-4? 자아 중심 연결망 예시213
?그림 10-5? 중재자 역할 분석 화면 창215
?그림 10-6? 중재자 역할 분석 결과216
?그림 10-7? Structural Holes 분석 실행 창217
?그림 10-8? C기업 비공식 연결망에서의 구조적 공백 지표218
?그림 12-1? QAP 분석 메뉴 실행260
?그림 12-2? QAP Regression 명령 실행창260
?그림 12-3? 4자 관계에서의 의존적인 연결 발생의 예262
?그림 12-4? ERGM의 대표적인 파라미터(예)263
?그림 13-1? 명령 프롬프트 창에서 KLT 폴더 이동하기270
?그림 13-2? 명령 프롬프트 창에서 KLT indext 프로그램 실행하기271
?그림 13-3? KLT indext 프로그램 실행 분석결과272
?그림 13-4? EXCEL에서 txt 파일 열기273
?그림 13-5? EXCEL 텍스트 마법사를 이용한 txt 파일 열기274
?그림 13-6? EXCEL에서 output1 파일 중 단어 목록 뽑아내기275
?그림 13-7? SAS/IML을 통해 도출한 단어 간의 관계 행렬(71*71)의 일부 모습278
?그림 13-8? Pajek으로 단어 연결망 시각화279
?그림 13-9? Gephi로 시각화279
?그림 14-1? NetMiner 4.2.2 화면 구성284
?그림 14-2? 상태 표시줄286
?그림 14-3? 1-mode Excel File 불러오기287
?그림 14-4? 2-mode Excel File 불러오기289
?그림 14-5? Spring 방식으로 시각화하기290
?그림 14-6? Node And Link Attribute Styling 팝업창291
?그림 14-7? Pajek64 실행 첫 화면293
?그림 14-8? Wolfe.paj 읽어들인 상태의 Pajek 실행 화면297
?그림 14-9? Wolfe.paj 1. kin.net 시각화300
?그림 14-10? Wolfe.paj 2. interact.net 시각화301
?그림 14-11? voc_net.mat의 일부302
?그림 14-12? Pajek 기본 시각화 화면303
?그림 14-13? Kamada-Kawai 방식으로 시각화303
?그림 14-14? 링크가 제거된 연결망 생성304
?그림 14-15? 동시등장 5회 이상 키워드 연결망305
?그림 14-16? K연결 정도 파티션 생성 후 화면306
?그림 14-17? 파티션 범위 설정307
?그림 14-18? 가중치가 포함된 그래프308
?그림 14-19? R-Studio 화면 구성309
?그림 14-20? R igraph 패키지를 이용한 연결망 시각화 예시311
?그림 14-21? Gephi 화면 구성312
?그림 14-22? 도구>플러그 인: 추가 설치 가능한 플러그 인313
?그림 14-23? .net 파일 읽기314
?그림 14-24? Fruchterman Reingold 레이아웃 실행 결과315
?그림 14-25? Appearance 탭에서 노드 사이즈 조정하기316
?그림 14-26? Edges/Labels 모양 설정316
?그림 14-27? Use node color 체크 박스 해제317
?그림 14-28? 연결망 지표 계산317
?그림 14-29? Modularity 계산창318
?그림 14-30? 노드 라벨에 Degree에 따른 크기 적용하기319
?그림 14-31? OpenOrd 레이아웃 적용, Label Adjust 적용320
표 차례
?표 2-1? 인터넷 사이트 종류별 클릭 이동량25
?표 2-2? 병원 내의 가상 연결망28
?표 2-3? 이미지 행렬의 예28
?표 3-1? 한국인의 학력 간 결혼 연결망의 구조38
?표 3-2? GSS 문항의 예시40
?표 4-1? 10개 도시 간 비행 거리70
?표 4-2? MDS의 종류72
?표 7-1? 집단을 분류하는 기준과 집단의 종류140
?표 7-2? 가상의 회사의 회사원들 정보150
?표 8-1? 병원 내 정보 관계망 행렬163
?표 8-2? 노드 간 정보 관계 중첩 여부 요약163
?표 8-3? 블럭 모델링(CONCOR) 결과173
?표 8-4? 이미지 행렬(절취점 0.7)174
?표 9-1? 사교 클럽 가입행렬 예시180
?표 9-2? 2-mode(n×c) 행렬 시각화를 위한 (n+c)×(n+c) 행렬182
?표 9-3? 사교 클럽 가입 행렬(<표 9-1>)로부터 계산한 정치인 간 준연결망183
?표 9-4? 사교 클럽 가입 행렬(<표 9-1>)로부터 계산한 사교 클럽 간준연결망184
?표 9-5? 1960-1975 학문 분야별 박사학위자 수(미국)185
?표 9-6? Social Networks 제43권의 서지 정보 일부189
?표 9-7? DL Edgelist2 형태로 논문-키워드 변환(예)190
?표 10-1? 자아 중심 연결망과 연결된 이들의 학력205
?표 10-2? 학력 관계 행렬207
?표 10-3? 자아 중심 연결망 조사 자료 변환 SAS IML 프로그램207
?표 11-1? IML 지원 연산자의 유형233
?표 12-1? 독립변수 및 통제 변수 구성259
?표 12-2? QAP Regression 계수 추정치261
?표 14-1? Pajek 메뉴 구조295
?표 14-2? Wolfe.paj 파일 구조298
"