포켓몬 고 커뮤니티가 기여한 8년과 1,000만 개의 이미지
게임 포켓몬 고를 개발한 Niantic이 공개한 정보에 따르면, 이 회사는 모바일 게임, 특히 포켓몬 고 와 Scaniverse 앱의 이미지 데이터와 지리적 좌표를 적용한 대규모 지리공간 모델(LGM)을 개발하고 있다고 합니다.
인터넷에서 텍스트, 오디오, 비디오 데이터를 사용하는 기존 AI 모델과 달리 LGM은 지난 8년 동안 사용자가 제공한 1,000만 개가 넘는 실제 위치 이미지를 기반으로 구축되었습니다. 평균적으로 매주 약 100만 개의 새로운 스캔이 플레이어에 의해 업로드됩니다. 대부분의 스캔은 보행자의 관점에서 이루어지므로, 자동차나 거리 카메라가 접근할 수 없는 구역에 대한 귀중한 데이터를 제공합니다.
LGM 모델 개발 프로세스
Niantic은 5년 동안 VPS(Visual Positioning System) 구축에 집중해 왔습니다. 이 시스템을 사용하면 사용자의 이미지 데이터로 생성된 3D 지도를 기반으로 단일 이미지에서 위치와 방향을 파악할 수 있습니다. 여기에서 LGM은 지리적으로 조정된 이미지를 통해 물리적 공간을 처리하는 한 단계 더 나아가 대규모 언어 모델(LLM)이 텍스트와 자연어를 처리하는 방식과 유사하게 구상되었습니다.
Niantic은 각각 특정 위치나 관점을 나타내는 5,000만 개 이상의 신경망을 훈련했다고 밝혔습니다. 이러한 신경망은 수천 개의 이미지를 총 150,000억 개의 매개변수를 갖는 디지털 표현으로 압축합니다. Niantic은 지역 네트워크를 결합하여 LGM이 전 세계 모든 위치를 인식할 수 있을 것으로 기대합니다. 심지어 이미지가 전에 본 적 없는 각도에서 촬영된 것이라도 말입니다.
Niantic은 LGM의 힘을 다음과 같은 예로 설명합니다. "만약 당신이 교회 뒤에 서 있고 모델이 정문만 인식한다면, 당신이 어디에 있는지 알 수 없을 겁니다. 하지만 LGM을 통해 우리는 전 세계 수천 개 교회의 데이터를 확보할 수 있었습니다. 이 교회들은 완전히 동일하지는 않지만, 비슷한 건축적 특징을 공유합니다. LGM은 해당 지식을 활용하여 식별할 것입니다."
LGM은 현재의 Lightship VPS 위치 시스템을 발전시킨 것으로, 플레이어가 센티미터 단위의 정확도로 실제 공간에 가상 아이템을 배치할 수 있게 해줍니다. 포켓몬 고 의 포켓몬 놀이터 기능은 이런 가능성을 보여주며, 포켓몬을 실제 위치에 배치해 다른 사람들이 찾을 수 있도록 합니다.
Niantic은 LGM이 증강 현실(AR) 및 혼합 현실(MR) 제품을 지원하는 것 외에도 로봇공학, 자동화, 자율 주행차, 물류 및 프로그래밍과 같은 다른 많은 분야에서도 잠재력을 열어준다고 밝혔습니다. 우주 계획
하지만 문제는 포켓몬 고 플레이어들이 자신들이 생성하는 데이터가 AI를 개발하는 데 사용된다는 사실을 완전히 알고 있는지 여부입니다. 이는 게임 서비스 약관에 언급되어 있지만, 세부 사항은 최근에야 공개되었습니다. 게이머들이 개인정보 보호와 데이터 사용 방식에 대해 점점 더 우려하고 있기 때문에, 이 사건은 앞으로 몇 달 동안 엇갈린 반응을 불러일으킬 가능성이 높습니다.
[광고2]
출처: https://thanhnien.vn/niantic-dung-du-lieu-pokemon-go-de-phat-trien-mo-hinh-ai-dinh-vi-185241120235020012.htm
Comment (0)