인기 게시물

에디터의 선택 - 2024

전문가에게 질문 : 소셜 네트워크가 우리를 지켜보고있는 것은 사실입니까?

드미트리 커킨

미국 문제의 대다수에 대한 응답 우리는 온라인으로 검색하는 데 사용했습니다. 새로운 일련의 자료에서 우리는 다양한 분야의 전문가에게 예기치 못한 또는 널리 퍼진 레코딩과 같은 질문을합니다.

올해 초 소셜 네트워크에서 시작된 10 년 챌린지 플래시 폭도는 사용자의 사진을 수집하고 얼굴 인식 시스템을 인식하도록 교육시키는 것이 음모 이론을 창출했을뿐만 아니라 우리에 대해 얼마나 많이 알고 있는지 다시 생각하게 만들었습니다. 소셜 네트워크 및 제 3 자 (상업 회사에서 정부 기관에 이르기까지)와 협력합니다.

기술 대기업들이 매일 수십억 명의 사용자가 남긴 이른바 디지털 발자국을 수집하고 분석한다는 사실은 누구에게도 비밀이 아닙니다. 그리고 이것에 대한 인식은 "형"에 대한 새로운 종류의 두려움을 야기합니다. 소셜 네트워크는 우리에 대해 많이 알고 있지만, 우리에 대해 너무 많이 알고 있다면 어떻게 될까요? 빅 데이터를 사용하여 사람의 모든 연결, 취향, 습관, 과거와 현재를 찾을 수 있습니까? 그렇다면 우리가 자발적으로 자신에 대한 정보를 공유하기 위해 온라인상에서 사교적 인 욕구를 가질 수있는 위험은 무엇입니까?

우리는 대기업에서 사용자 데이터를 처리하는 방법과 소셜 네트워크에서 상속하는 것이 얼마나 위험한 지 전문가에게 질문했습니다.

릴리 야 젬누 쿠바

세인트 피터스 버그 유럽 대학 과학 기술 연구 센터 연구 위원

디지털 풋 프린트는 텍스트, 이미지, 오디오 및 비디오 레코딩, 위치 정보 및 많은 메타 데이터 (예 : 가제트 모델, 이동 통신사, 운영 체제, 방문의 동적 및 지속 시간 등)와 같은 모든 가능한 유형의 데이터를 포함합니다. 디지털 발자국을 보충하는 것은 우리뿐 아닙니다. 소셜 네트워크는 세 가지 데이터 소스를 통해 사용자를 형성합니다. 다른 사람들이 우리에 대해보고합니다. 우리가 알지 못하는 사이에 무엇이 가장 자주 일어나는가. 특히 불투명 한 마지막. 우리는 원칙적으로 개인 정보의 수집 및 사용에 대한 사용자 계약 및 정책을 읽지 않습니다. 우리는이 "블랙 박스"가 어떻게 든 타겟 광고, 친구의 제안, 음악 추천, 뉴스 시작 절차에 영향을 미친다는 점만주의해야합니다 ... 우리는 수동으로 뉴스 피드를 구축 할 때이 경험의 작은 부분을 구성하지만 주로 알고리즘 기본 프로파일에 임베드 된 기능을 수행하십시오. 그렇기 때문에 문맥 광고 나 그룹 또는 친구가 아닌 사람들의 개입을 절대로 없앨 수 없습니다. 기업용 소셜 네트워크는 상업적 목적으로 사용자에 관한 데이터를 사용하여 대상 콘텐트 판매를위한 플랫폼을 제공합니다. 그 과정에서 그들은 계속해서 우리에 관한 데이터를 수집합니다. 예를 들어 최소한 한 번 광고비를 지불하면 은행 카드와 거래 데이터도 회사에 남아있게됩니다. 데이터가 필요한 경우 정부 기관에 데이터를 제공 할 수도 있습니다. 예를 들어 Facebook은 투명성 정책에 따라 미국 정부 기관과 정기적으로 협력합니다.

소셜 네트워크의 내부 정책 외에도 하나의 중요한 세부 정보가 있습니다. 계정은 수십만 개의 다른 응용 프로그램 및 기능과 관련 될 수 있습니다. 예를 들어 작년에 사용자 데이터에 대한 제 3 자 액세스에 대한 큰 토론이있었습니다. 유럽 ​​연합에서 개발자의 자유를 규제하려는 중요한 시도가있었습니다. GDPR (General Data Protection Regulations)이 작년에 발효되었습니다. 그는 데이터 문제를 전송하지 않기로 결정했지만 사용자의 관심을이 질문에 이끌었습니다. 이것은 우리가 모든 사용자 동의서를 읽는 것을 강요하지는 않지만 우리의 디지털 발자국을 생각하고 최소한 책임을지고 디지털 위생의 기본 규칙을 따르도록합니다.

발레리아 카라바 에바

스파이 킹의 데이터 과학자

때로는 웹에 남긴 트랙의 수와 소셜 네트워크뿐 아니라 회사가 소셜 네트워크를 얼마나 도움이되는지 생각할 때가 있습니다. 소셜 네트워크는 데이터를 수집 할뿐만 아니라 판매 할 수도 있습니다. 광고 대행사에서 일했기 때문에 그 사실을 알았고 Facebook에서 데이터를 구입했습니다. 가장 흔히 사용자 인 우리는이를 알지 못하고 동의를합니다. 사람들은 소셜 네트워크에 절반의 목숨을 쏟고 자신에 대한 많은 정보를 제공합니다.

그러나 이전에 데이터를 수집하는 것이 가능했기 때문에 왜 최근에야 대용량 데이터에 관해 이야기하기 시작 했습니까? 우선, 컴퓨팅 성능이 향상되고 이에 따라 비용도 저렴 해지기 때문입니다. 큰 데이터의 주요 문제는 데이터를 수집하는 방법이 아닙니다. 원칙적으로 우리 각자는 오늘날 테라 바이트의 정보를 수집하고 저장할 수 있습니다. 소셜 네트워크 (텍스트, 음성, 사진, 비디오)에서 얻은 대부분의 데이터는 어떤 방식으로도 구성되지 않으므로 기계 학습없이 큰 데이터는 쓸모가 없습니다. 이제 힘과 기억이 더 저렴 해짐에 따라 신경망에 대한 요구와 심층 학습에 대한 요구가 증가했습니다. 마침내 우리는 대용량 데이터 배열을 처리하는 방법을 배웠습니다.

예를 들어, 사진을 찍으십시오 - 이것은 정말 큰 데이터입니다, 그들은 많은 정보를 줄 수 있습니다. 수백만 장의 사진이 있지만 그것들과 무엇을해야합니까? 어떻게 그들로부터 혜택을받을 수 있습니까? 그들이 당신에게 어떤 패턴을 알려주고 있습니까? 실제로 기계 학습은 그리 멀지 않았습니다. 이것은 단순한 과정이 아닙니다. 단추를 누르고 일주일 만에 완전한 계산을받는 것은 아닙니다.

직접 기계 학습은보다 복잡한 작업이 선행됩니다. 같은 그림을 먼저 적절하게 처리해야합니다 (예 : 자른 사진, 가운데에 올린 사진 등). 이것은 학습에 중요합니다. 이것은 대개 오래 걸리는 첫 번째 단계입니다. 두 번째 단계는 문제를 해결하는 데 적합한 네트워크 아키텍처를 선택하는 것입니다. 대충 말하면 10 개의 다른 신경망을 만들고 10 가지 다른 결과를줍니다. 그런 다음 결과를 어떻게 든 평가해야합니다. 그 후에는 높은 확률로 첫 번째 단계로 돌아갑니다. 모든 작업에 대해 하나의 범용 네트워크를 구축하는 것은 불가능합니다. 처음부터 다시 구축하거나 기존 네트워크를 수정하십시오. 얼굴 인식은 하나의 과제이며, 고양이의 인식은 또 다른 과제입니다.

기계 학습의 과정에서 우리는 그것을 알지 못해도 참여합니다. 예를 들어 사이트에 captcha를 도입하는 경우 captcha를 사용하여 Google에서 훈련 된 신경망을 사용하여 책을 디지털화합니다.

큰 데이터를 수집하는 회사는 우리의 개인 프로파일에 관심이 없다는 것을 이해해야합니다. 그들은 특정한 것에 관심이있는 많은 사람들에 관한 데이터를 필요로합니다. 특수 서비스는 소셜 네트워크에 의지하지 않고도 데이터를 수집 할 수 있다고 생각합니다. 나는 우리가 지켜보고있는 우리의 두려움이 곧 사라질 것이라고 생각한다. 이것은 새로운 세계입니다 : 웹을 상속하지 않는 것이 가능하지만 어렵습니다. 웹에 전혀 나타나지 않는 것이 더 쉽습니다.

사진 : antonsov85 - stock.adobe.com

귀하의 코멘트를 남겨