스마일게이트 AI센터, 악플·혐오 발언 데이터셋 공개

  • 등록 2022-01-20 오전 10:05:51

    수정 2022-01-20 오전 10:05:51

[이데일리 김정유 기자] 스마일게이트 AI센터는 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.

스마일게이트 AI 센터는 최근 온라인상에서 혐오 표현 늘어나고 있는만큼 악플 발언 데이터셋을 구축했다. 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

악플 및 혐오 발언 데이터는 2019년 1월 1일부터 2021년 7월 1일까지 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다. 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했고, 약 55만개의 데이터를 기반으로 1만개의 데이터셋을 구축했다.

데이터셋 구축 과정에서는 ‘여성/가족’ ‘성소수자’ ‘남성’ ‘인종/국적’ ‘연령’ ‘지역’ ‘종교’ ‘기타혐오’ 등 8개의 대상을 범주화 했다. 또 혐오 발언 분류를 위한 기준 모델도 공개했다.

스마일게이트 AI 센터의 악플 및 혐오 발언 데이터셋은 향후 다양한 영역에서 활용될 것으로 기대된다. 이번에 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지를 통해 이달 중 공개될 예정이다.

한우진 스마일게이트 AI 센터장은 “이번에 공개된 데이터가 혐오 표현이나 인공지능의 윤리성이 사전에 분류 및 예방되어 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다”며 “향후 스마일게이트 AI 센터는 그 동안 진행해온 연구 결과와 노력들이 기술적인 관점에서 뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것“이라고 말했다.

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

스무살의 설레임 스냅타임

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • 빠빠 빨간맛~♬
  • 이부진, 장미란과 '호호'
  • 홈런 신기록
  • 그림 같은 티샷
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원

ⓒ 이데일리. All rights reserved