Vietnam.vn - Nền tảng quảng bá Việt Nam

AI가 생성한 이미지의 편향 사례

Công LuậnCông Luận13/07/2023

[광고_1]

AI 이미지 생성기는 어떻게 작동하나요?

AI 기반 이미지 생성기는 기계 학습 모델을 사용하여 사용자가 입력한 텍스트를 가져와 설명과 일치하는 하나 이상의 이미지를 생성합니다. 이러한 모델을 훈련하려면 수백만 개의 이미지가 포함된 방대한 데이터 세트가 필요합니다.

이 그림에 이상한 오류를 만든 사람은 누구인가요? 이미지 1

AI를 이용해 이미지를 만드는 것이 점점 쉬워지고 있습니다. 사진: 아이넷

Midjourney와 DALL-E 2 모두 알고리즘이 정확히 어떻게 작동하는지 공개적으로 공개하지 않지만, 대부분의 AI 이미지 생성기는 확산이라는 프로세스를 사용합니다. 확산 모델은 훈련 데이터에 무작위의 "노이즈"를 추가한 다음, 이러한 노이즈 부분을 제거하여 데이터를 재구성하는 방법을 학습하는 방식으로 작동합니다. 모델은 입력과 일치하는 이미지를 찾을 때까지 이 과정을 반복합니다.

이는 ChatGPT와 같은 대규모 언어 모델과는 다릅니다. 대규모 언어 모델은 레이블이 지정되지 않은 텍스트 데이터를 사용하여 학습되고, 이를 분석하여 언어 패턴을 학습하고 인간과 유사한 반응을 생성합니다.

일반적인 AI에서는 입력이 출력에 영향을 미칩니다. 사용자가 이미지에 특정 피부색이나 성별을 가진 사람만 포함하도록 지정하는 경우, 모델은 이를 고려합니다.

하지만 이보다 더 나아가 모델은 특정 이미지를 반환하는 경향이 있습니다. 이는 종종 훈련 데이터의 다양성이 부족하기 때문에 발생합니다.

최근 연구에서는 Midjourney가 전문화된 미디어 직업(예: "뉴스 분석가", "뉴스 해설자", "사실 확인자")과 보다 일반적인 직업(예: "기자", "리포터", "저널리즘")을 포함한 겉보기에 일반적인 용어를 어떻게 시각화하는지 살펴보았습니다.

이 연구는 작년 8월부터 실시되었으며, 6개월 후에 결과를 반복하여 이 기간 동안의 시스템 진행 상황을 검토했습니다. 연구진은 이 기간 동안 AI가 생성한 100개 이상의 이미지를 분석했습니다.

연령차별과 성차별

이 그림에 이상한 오류를 만든 사람은 누구인가요? 이미지 2

특정 직업의 경우, 연장자는 항상 남성입니다. 사진: IJN

구체적인 직함이 없는 경우 Midjourney는 젊은 남성과 여성의 이미지만 보여줍니다. 전문적인 역할의 경우 젊은이와 노인이 모두 등장하지만, 노인은 항상 남성입니다.

이러한 결과는 노령자는 비전문적인 직책에서 일하지 않는다는 가정, 전문적인 업무에는 노령 남성만이 적합하다는 가정, 덜 전문화된 업무는 일반적으로 여성을 위해 남겨진다는 가정을 포함하여 여러 가지 고정관념을 암묵적으로 강화합니다.

남성과 여성이 소개되는 방식에도 눈에 띄는 차이가 있습니다. 예를 들어, 여성은 젊고 주름이 없는 반면, 남성은 주름이 있어도 '허용'됩니다.

AI는 더 유동적인 성적 표현의 예를 보여주기보다는 성별을 이분법으로 표현하는 것으로 보입니다.

인종적 편견

이 그림에 이상한 오류를 만든 사람은 누구인가요? 이미지 3

"기자"나 "저널리스트"의 이미지에는 종종 백인만 등장합니다. 사진: IJN

"기자", "리포터"와 같은 검색어로 검색한 이미지는 모두 백인의 이미지만 보여줍니다.

이는 AI의 기본 훈련 데이터에서 다양성이 부족하고 대표성이 낮음을 반영할 수 있습니다.

계급주의와 보수주의

그림 속의 모든 캐릭터는 "보수적인" 모습을 하고 있습니다. 예를 들어, 누구도 문신, 피어싱, 특이한 헤어스타일 또는 전통적인 설명과 구별되는 다른 특징을 가지고 있지 않습니다.

많은 사람들은 셔츠나 정장 등 정장을 입기도 합니다. 이는 계층적 기대의 표시입니다. 이런 복장은 텔레비전 진행자와 같은 특정 역할에는 적합할 수 있지만, 기자나 언론인의 일반적인 옷차림을 반드시 반영하는 것은 아닙니다.

도시주의

이 그림에 이상한 오류를 만든 사람은 누구인가요? 이미지 4

모든 이미지는 기본적으로 도시를 배경으로 하지만 지리적 참조는 없습니다. 사진: IJN

AI가 반환한 이미지에는 위치나 지리적 맥락이 명시되어 있지 않음에도 불구하고, 고층 빌딩이나 번화한 동네와 같은 도시 공간이 포함되어 있습니다. 이는 사실이 아닙니다. 전 세계 인구의 절반 이상이 도시에 살고 있기 때문입니다.

구식

미디어 종사자의 이미지에는 타자기, 프린터, 빈티지 카메라와 같은 구식 기술이 포함됩니다.

오늘날 많은 전문가들이 똑같아 보이기 때문에 AI는 설명된 역할을 더욱 뚜렷하게 만들기 위해 더욱 차별화된 기술(오래되고 사용되지 않는 기술 포함)에 의존하는 것으로 보입니다.

따라서 AI 이미지를 직접 만드는 경우 설명을 작성할 때 잠재적인 편견을 고려해야 합니다. 그렇지 않으면, 사회가 수십 년 동안 근절하려고 노력해 온 해로운 고정관념을 무심코 강화하게 될 수도 있습니다.

황톤 (IJN에 따르면)


[광고_2]
원천

태그: 편견

댓글 (0)

No data
No data

같은 태그

같은 카테고리

타코우 숲으로 가다
조종사는 '4월 30일 붉은 깃발 바다 위를 날며 조국을 향한 마음이 떨렸다'는 순간을 회고합니다.
도시. 호치민, 통일 50주년
하늘과 땅이 화합하고 산과 강이 행복하다

같은 저자

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품