Chúng tôi chia sẻ nhiều nội dung với tiêu đề trầm cảm và tự tử trên Instagram hơn chúng tôi nghĩ. Cuộc cách mạng Dữ liệu lớn đã giúp nó có thể phân tích một lượng lớn nội dung trên mạng xã hội. Họ tiết lộ điều gì về chúng ta? Trợ lý giáo sư Zoltán Kmetty đã báo cáo về kết quả của một nghiên cứu mới tại một buổi thuyết trình thú vị do ELTE TÁTK Sociology SzHÉK tổ chức

Chủ đề tự tử đã có mặt trong các diễn ngôn nghiên cứu từ thời kỳ đầu của xã hội học. Durkheim Tự sát c. Cuốn sách tiên phong của ông là một trong những tác phẩm kinh điển trong lĩnh vực này cả về nội dung và phương pháp luận. Tuy nhiên, kể từ khi tác phẩm được xuất bản vào năm 1897, thế giới xung quanh chúng ta đã thay đổi về cơ bản: với sự lan rộng của điện thoại di động, thiết bị internet và mạng xã hội, một lượng dữ liệu gần như không thể tưởng tượng được đã được tạo ra. Câu hỏi là chúng ta có thể làm gì với nó.
1 Cuộc cách mạng Dữ liệu lớn trong khoa học xã hội
Với số hóa, một lượng dữ liệu như vậy được tạo ra mỗi ngày mà các nhà khoa học xã hội không thể thực sự xử lý bằng các phương pháp trước đây. Zoltán Kmetty - trợ lý giáo sư ELTE-TÁTK và nhà nghiên cứu sau tiến sĩ MTA-TK CSS-RECENS - nhấn mạnh trong bài thuyết trình của mình rằng điều khiến những dữ liệu này trở nên đặc biệt là chúng không được tạo ra cho mục đích nghiên cứu, nhưng chúng tiết lộ rất nhiều về suy nghĩ, hành vi và sở thích của mọi người. Dữ liệu lớn bao gồm dữ liệu của các thiết bị được kết nối Internet, thông tin di động (ai đang ở đâu), cơ sở dữ liệu giao dịch (ví dụ: cơ sở dữ liệu của ngân hàng) hoặc các hình thức hiện diện khác nhau trên Internet (blog, tìm kiếm, nội dung truyền thông xã hội).
Vấn đề truy cập vào một lượng lớn dữ liệu là điều thú vị ngoài các cân nhắc về bảo vệ dữ liệu. Mặc dù nhiều người mong đợi sự dân chủ hóa nghiên cứu từ sự bùng nổ của cuộc cách mạng dữ liệu, nhưng chúng ta thấy rằng các tác nhân có đặc quyền của phương Tây đang được phép sử dụng nhiều dữ liệu dễ dàng hơn nhiều so với những người khác. Hiện tượng này cũng có vấn đề vì nó làm cho việc tái tạo và khả năng xác minh của các bài kiểm tra trở nên khó khăn.

2 Khai thác văn bản đang bùng nổ
Dữ liệu là một phần của Dữ liệu lớn không phải lúc nào cũng là số, mà thường là văn bản. Zoltán Kmetty tin rằng việc phân tích một lượng lớn văn bản đặt ra thách thức lớn hơn nhiều đối với các nhà nghiên cứu, trong khi
hầu như bất kỳ ai cũng có thể thực hiện các phân tích tốt từ cơ sở dữ liệu có cấu trúc tốt với đầy đủ các con số.
Mặc dù xử lý ngôn ngữ tự nhiên (NLP) và khai thác văn bản đã đạt được vai trò lớn hơn trong những năm gần đây, việc phân tích văn bản không phải là một điều mới trong khoa học xã hội. Các học giả đã giải quyết vấn đề này trong một thời gian dài, nhưng mục tiêu là nghiên cứu chuyên sâu và định tính hơn về một lượng văn bản nhỏ hơn. Phương pháp định lượng bắt đầu xuất hiện vào những năm 1980, chủ yếu từ khía cạnh ngôn ngữ.
Cuộc cách mạng máy tính không chỉ cho phép phân tích định lượng văn bản mà còn thay đổi hoàn toàn cách phân tích dữ liệu. Chúng ta biết từ "truyền thuyết" của các đồng nghiệp lớn tuổi rằng trong thời đại anh hùng, các nhà khoa học có thể đi uống cà phê, suy nghĩ và nói chuyện trong tối đa hai giờ, trước khi một phân tích đơn giản hơn được chạy trên dữ liệu. Khả năng tiếp cận máy tính hạn chế, cũng như khả năng tính toán thấp của máy móc theo quan điểm ngày nay, đòi hỏi một loại hình khoa học xã hội hoàn toàn khác, nơi cần phải thực hiện nhiều hơn nữa. Ngày nay, họ chạy tất cả các loại mã và sau đó xem họ có thể làm gì với kết quả. Theo Zoltán Kmetty, cách tiếp cận này không hẳn là may mắn.
Điều quan trọng là các nhà nghiên cứu tiếp tục được hướng dẫn bởi những câu hỏi hay trong biển dữ liệu.

3 Chúng ta có thể học được gì từ các văn bản?
Các nhà nghiên cứu có thể kiểm tra, ví dụ, tần suất xuất hiện của một số từ nhất định, sự phát triển của chúng theo thời gian hoặc sự khác biệt của chúng giữa các phương tiện khác nhau. Hãy cho biết Origo hoặc Index sử dụng thuật ngữ di cư và tị nạn bao nhiêu lần. Họ có thể thực hiện cái gọi là cũng phân tích tình cảm, trong trường hợp cảm xúc được liên kết với các từ trong văn bản dựa trên một từ điển được phân loại trước, thường đặt các biểu hiện theo chiều tích cực-tiêu cực. Ví dụ, họ có thể xem những từ mà khách du lịch đến Rome, Prague hoặc Budapest đăng về kỳ nghỉ của họ. Tất nhiên, thể loại này cũng có những khó khăn của nó:
Ví dụ,trớ trêu là rất khó phân tích.
Các nhà khoa học cũng có thể xác định môi trường ngữ nghĩa cho các thuật ngữ riêng lẻ. Với sự trợ giúp của các mô hình nhúng từ, chúng có thể lập bản đồ khoảng cách giữa các từ. Chẳng hạn, trong một cơ sở dữ liệu bao gồm hàng tỷ từ, họ đã tìm kiếm các tên nghề nghiệp khác xuất hiện gần giống như thế nào trong ngữ cảnh ngôn ngữ của thuật ngữ nhà xã hội học. Họ phát hiện ra rằng trong khi các từ ngữ nhà dân tộc học, nhà nhân chủng học hoặc nhà tội phạm học nhỏ hơn, các thuật ngữ nhà thần học, nhà sinh vật học và nhà thống kê lại xa hơn nhiều.

Một phương pháp phân tích văn bản phổ biến cũng là xác định các chủ đề (chủ đề) tiêu biểu trong tài liệu. Eszter Katona, Renáta Németh và Zoltán Kmetty đã phân tích, ví dụ, chủ đề của các bài báo về vấn đề tham nhũng đã thay đổi như thế nào trong khoảng thời gian mười năm: khi mua sắm công, chính quyền địa phương đang trong chương trình nghị sự, hay chính xác là cách Lőrinc Mészáros xuất hiện trên hiện trường.
4 Tự tử để lại dấu ấn gì trên không gian trực tuyến?
Vì rất khó truy cập Facebook cho mục đích nghiên cứu, hầu hết các nghiên cứu tập trung vào vấn đề tự tử và trầm cảm cho đến nay đều tập trung vào các tìm kiếm trên Google và Twitter. Các nghiên cứu đã được công bố cho thấy kết quả đáng chú ý:
- Phân tích mười năm các bài đăng trên Twitter, Kristoufek và cộng sự đã tìm thấy mối tương quan giữa tỷ lệ tự tử hàng tháng của Vương quốc Anh và các tìm kiếm từ tự tử / trầm cảm. Tất nhiên, điều này không có nghĩa là những người duyệt nội dung như vậy sẽ tự sát. Nhưng sự quan tâm ngày càng tăng đối với chủ đề nói lên rất nhiều điều về môi trường xã hội mà những trường hợp này diễn ra.
- Trong nghiên cứu tâm lý của họ với một số lượng nhỏ người Nhật tham gia, Sueki và cộng sự đã xác nhận rằng những người đăng các tweet có chứa cụm từ "Tôi muốn chết" hoặc "Tôi muốn tự tử" đạt điểm cao hơn đáng kể trên thang điểm. đo lường mức độ tự tử, vì vậy họ có khả năng gây ra mối nguy hiểm lớn hơn cho bản thân.
- Một trong những nghiên cứu của Mỹ được trích dẫn nhiều nhất về chủ đề này đã kiểm tra sự phân bố địa lý của các tin nhắn Twitter bị tính phí tiêu cực ở Hoa Kỳ. Theo kết quả của Jashinsky và các đồng nghiệp của anh ta, số lượng tội phạm cao hơn ở các bang mà từ đó các bài viết tiêu cực được đăng nhiều nhất.

5 Bạn có biết rằng hầu hết các vụ tự tử không xảy ra vào mùa đông?
Nhiều nghiên cứu đã đề cập đến mô hình tự tử theo thời gian. Từ kiến thức tích lũy được cho đến nay, hóa ra nhiều vụ tự tử nhất diễn ra vào thứ Hai mỗi tuần và trái với suy nghĩ của nhiều người, nhiều vụ tự tử nhất diễn ra vào mùa xuân và mùa hè. Lý do chính xác cho lý do thứ hai vẫn chưa rõ ràng, có lẽ nó cũng có thể được giải thích bởi thực tế là việc thực hiện một hành động như vậy thường không diễn ra trong giai đoạn không hoạt động của bệnh trầm cảm sâu, mà là khi ai đó ở trong trạng thái đủ năng lượng để thực hiện. hành động. Mặc dù các phương tiện truyền thông coi đó là tin tức nổi bật khi ai đó kết thúc cuộc đời vào Giáng sinh, nhưng các con số cho thấy tỷ lệ tự tử ở thời điểm này là thấp, ngay cả khi đó là thời điểm thực sự khó khăn đối với nhiều người.
6 Chúng tôi đăng mọi thứthiếu trầm cảm trên Instagram?
Zoltán Kmetty cũng báo cáo về kết quả gần như cuối cùng của một nghiên cứu đang diễn ra. Với đồng tác giả của mình, Júlia Koltai và Károly Bozsonyi, họ đã phân tích hơn 4 triệu bài đăng trên Instagram trong 3 năm qua (dữ liệu được thu thập bởi công ty SentiOne). Họ tìm kiếm các thẻ bắt đầu bằngbằng tiếng Anh như tự tử, trầm cảm, lo lắng, sức khỏe tâm thần, tự làm hại bản thân, buồn bã, cắt đứt, cô đơn hoặc thậm chí lưỡng cực.

Trong quá trình phân tích, họ nhận thấy rằng chúng tôi đăng nhiều nội dung dưới các tiêu đề như vậy hơn nhiều người nghĩ lúc đầu và chỉ một phần nhỏ của các bài đăng thực sự liên quan đến việc tự hại bản thân. Các nhà xã hội học đã tách các chủ đề nhận được thành 7 nhóm, chiếm gần 80% tổng số lượt truy cập.
- 11 phần trăm meme
- 11 phần trăm bài viết nghệ thuật (thơ, ảnh)
- 8% bài đăng liên quan đến người LGBTQ và EMO
- 6 phần trăm trích dẫn (thơ tình, lời bài hát)
- 16 phần trăm các bài đăng liên quan đến bệnh tâm thần và sức khỏe
- 14 phần trăm bài đăng về việc tự làm hại bản thân
- 11 phần trăm bài đăng liên quan đến thể dục
Người LGBTQ có nhiều người tự tử hơn không?
Một số cuộc khảo sát đã cho thấy mức độ gia tăng nguy cơ tự tử đối với những người có khuynh hướng tình dục khác với đa số, và đặc biệt là đối với những người chuyển giới. Theo kết quả gây sốc của Hiệp hội người chuyển giới Transvanilla, trong một cuộc khảo sát trong nước năm 2014, 53,7% người chuyển giới được khảo sát đã suy nghĩ nghiêm túc về việc tự tử; Và 44,4% đã cố gắng làm như vậy. Bối cảnh của hiện tượng này chủ yếu là căng thẳng thiểu số, áp lực mà người LGBTQ phải tiếp xúc do chứng kỳ thị đồng tính và chứng sợ đồng tính luyến ái hiện hữu trong xã hội.
Khi phân tích các bài đăng trên Insta, Kmetty và các đồng nghiệp của mình đã điều tra nhóm chủ đề này một cách riêng biệt. Trong số các cụm từ liên quan đến từ viết tắt LGBTQ, chỉ có từ đồng tính là thể hiện mối liên hệ rõ ràng với các bài viết về tự tử. Rất khó để nói động cơ chính xác của các bài đăng, nhưng dữ liệu cho thấy rõ ràng rằng có một cuộc thảo luận về mối quan hệ giữa đồng tính và tự tử trên mạng xã hội. Chẳng hạn, có thể xảy ra trường hợp ai đó thú nhận về sự tuyệt vọng của chính mình, rằng anh ta sợ người khác hoặc anh ta thu hút sự chú ý đến tầm quan trọng của chủ đề nói chung.
7 Có rất ít phản hồi về các bài đăng tự làm hại bản thân
Những biểu hiện liên quan đến việc tự làm hại bản thân được các đồng nghiệp trên mạng xã hội khen thưởng bằng những lời củng cố tích cực. Theo nghiên cứu, những bài đăng này được like ít nhất: số lượt thích trung bình chỉ là 6, trong khi bài đăng về thể dục là 12 và bài về nghệ thuật và LGBTQ / EMO là 11. Các hành vi tự gây nguy hiểm cho bản thân dường như ít nhận được phản ứng, với trung bình 0,6 nhận xét, so với 1,3 nhận xét cho các trích dẫn hoặc bài đăng về thể dục.
8 Họ thể hiện phân bố thời gian và cảm xúc nào?
Trái ngược với mô hình thời gian đã biết từ nghiên cứu trước đó, mọi người ít đăng bài về việc tự làm hại bản thân trên Instagram hơn vào mùa hè, trong khi số lượng bài đăng như vậy tăng lên vào mùa đông. Các xu hướng mà chúng ta thấy trong trường hợp tự tử thực sự không giống nhau: 30% bài đăng tự hại được thực hiện vào cuối tuần và phần lớn được thực hiện trong khoảng thời gian từ 6 giờ sáng đến 10 giờ tối hàng ngày. Về nội dung cảm xúc, các bài đăng tự hại bản thân cho đến nay là tiêu cực nhất, thường liên quan đến nỗi buồn, sự sợ hãi và tức giận.

9 Thật tuyệt khi nhận ra đâu là tiếng kêu cứu thực sự
Mặc dù nhóm người tham gia được biết đến trong các nghiên cứu bảng câu hỏi cổ điển, chúng tôi biết rất ít về tác giả của các bài đăng và hơn nữa, mọi người có thể đăng bài về tự tử theo năm trăm cách khác nhau. Phân tích văn bản có thể giúp lập bản đồ: đâu là sự kết hợp thực sự cần được chú ý, vì chúng thực sự có thể chỉ ra nguy cơ tự sát. Dựa trên cơ sở này, có thể xác định các nhóm nguy cơ mà điều quan trọng là tổ chức các chương trình can thiệp và phòng ngừa. Tất nhiên, cũng có câu hỏi đặt ra là nên dành bao nhiêu dung lượng cho các bài đăng liên quan đến tự tử trên mạng xã hội: chẳng hạn, nội dung về graffiti hoặc hình ảnh mô tả cổ tay có sẹo nên được lọc ra. Đâu là giới hạn trong việc này, ai sẽ là người vẽ ra và dựa trên cơ sở nào? Phủ nhận có phải là giải pháp cho một hiện tượng gây sốc, đau đớn, tiêu cực nhưng rất nhân văn không?