Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[20220220] Weekly AI ArXiv 만담 - 40회차 #40

Closed
jungwoo-ha opened this issue Feb 19, 2022 · 7 comments
Closed

[20220220] Weekly AI ArXiv 만담 - 40회차 #40

jungwoo-ha opened this issue Feb 19, 2022 · 7 comments

Comments

@jungwoo-ha
Copy link
Owner

jungwoo-ha commented Feb 19, 2022

@nick-jhlee
Copy link

nick-jhlee commented Feb 19, 2022

NeurIPS'21 paper 찾고 ICLR'22 paper 찾고 ICML submission 찾고... 이건 축복보단 저주에 가까운거 같네요 ㅎㅎㅎ,,,

Screen Shot 2022-02-20 at 10 07 17 PM

Screen Shot 2022-02-20 at 10 08 28 PM

Screen Shot 2022-02-20 at 10 07 34 PM

Screen Shot 2022-02-20 at 10 15 15 PM

@ghlee0304
Copy link

ghlee0304 commented Feb 19, 2022

@hollobit
Copy link

hollobit commented Feb 20, 2022

AI 연구 주도권을 향한 중국의 경쟁

https://www.statista.com/chart/26862/countries-and-regions-with-highest-number-of-ai-research-papers-submitted-per-year/

  • 미국은 2021년에 발표된 AI에 관한 약 150,000편의 연구 논문으로 여전히 세계를 주도하고 있지만 중국의 추격을 받고 있음
  • 중국의 논문 편수 20년 동안 3,350퍼센트 증가

올림픽의 미래 기술: AI, IoT 및 로봇

  • 200개 이상의 새로운 기술이 동계 올림픽에서 테스트되고 사용
  • 40개 이상의 테스트 이벤트 심사에 참여하는 인공 지능(AI) 지원 심판 및 코치 시스템을 개발
  • 전문적이고 정확한 AI 수화 통역
  • AI로 선수의 경기력 향상
  • 성과 데이터를 분석하여 훈련, 휴식 및 영양을 위한 개인화된 솔루션을 생성할 수 있는 AI 프로그램
  • AI 기반 3D Athlete Tracking(3DAT)를 통해 경기 및 이벤트 중 팬에게 거의 실시간 데이터를 제공
  • 중국 하얼빈 공과대학(HIT) 로봇 컬링 코치 - https://www.youtube.com/watch?v=P35i-1TjnAI&feature=emb_imp_woyt
  • 버거와 다른 따뜻한 식사를 준비하는 AI 지원 셰프 봇
  • 원두를 갈아 자바를 내리는 커피 로봇

인공 지능 생성 얼굴을 실제 얼굴보다 더 신뢰할 수 있다는 연구 결과

  • 실제 사람의 얼굴과 AI StyleGAN2 합성 얼굴을 구별하는 데 어려움
  • 합성 얼굴의 평균 평점은 통계적으로 유의한 실제 얼굴의 평균 평점보다 7.7% 더 신뢰
  • 이젠 기술적 안전 장치가 필요해지는 시점
  • 그래픽 및 비전 커뮤니티가 연구원, 발행인 및 미디어 배포자를 위한 윤리적 지침을 통합하는 합성 미디어 기술의 생성 및 배포에 대한 지침을 개발할 것을 권장

@kimyoungdo0122
Copy link

kimyoungdo0122 commented Feb 20, 2022

  • News
    • mlcon 행사 소식

      • 홈페이지
      • 22일 오전 10시 30분부터 (현지시간, 우리나라는 수요일 자정 쯤)
      • 다양한 AI/ML 개발 관련 이야기
    • 작년말 Weekly Arxiv 33회차에 How Do ViT work? 라는 연구를 소개해주셨던 남욱 님 ICLR 억셉되셨었네요, 늦게나마 축하드립니다!

    • Data-centric AI Resource Hub 사이트 오픈

      • Data-centric AI를 위한 지식 정보 공유 공간 + 커뮤니티
      • 포스팅을 통해 기여할 수 있으니 관심있는 연구자 개발자분들께서는 한번쯤 방문해보시는 것도 좋겠습니다!
      • Labeling and Crowdsourcing
      • 크라우드 소싱을 활용하여 데이터 라벨링을 진행해야 하는 분들께서 보시면 좋을 글

image

image
image

@terryum
Copy link

terryum commented Feb 20, 2022

  • arxiv (blog)

    • 논문 & 블로그
      "Does Your Dermatology Classifier Know What It Doesn't Know? Detecting the Long-Tail of Unseen Conditions", Roy et al., 2021. [Google Blog, arxiv]

    • 문제
      : 실제 진단을 하다보면 흔한 질환들도 있지만, 매우 드물게 발견되는 희귀 질환의 class가 매우 많다. 수백가지의 피부 질환이 전체 피부질환의 20%의 양을 차지하는 롱테일의 데이터 분포를 가지고 있다고 한다. (예를 들어 피부 질환을 다루는 이 논문에선 26개의 흔한 질환 class와 68개의 희귀 질환의 class(=샘플 수도 적음)를 사용하였다)

    image1
    image

    이들은 out-of-distribution (OOD) 문제로 해석되곤 한다. OOD 문제는 데이터셋 자체가 달라서 쉽게 알 수 있는 OOD 문제도 있지만 (e.g. CIFAR로 학습한 후 SVHN 데이터를 테스트 할 경우 OOD로 판별), 같은 도메인에서 의미만 다른 경우 (e.g. 피부병이지만 학습되지 않은 클래스의 피부병이 있는 경우 OOD로 판별)도 OOD 문제로 볼 수 있는데, 여기선 후자의 near-OOD detection 문제를 풀었다.

    • 해결 방법
      : Loss에서 classification loss만 쓰는 것이 아니라, 이것이 많이 발견되는 질환인지 아니면 희귀한 질환인지를 binary로 판별하는 binary classification loss를 넣어 이들을 합쳐 더 좋은 representation을 학습하고자 하였다. (여기선 이를 hierarchical outliner detection, HOD라 부른다)

    image

    pretrained model을 만들 때도 위와 같은 loss를 적용해 pretraining을 하면 성능이 약간 향상되고, 거기에 ensemble까지 더 하면 또 성능이 향상된다. (prediction uncertainty가 있는 문제에서 ensemble은 늘 도움이 되는...)

    • 평가 방법
      : '많이 발견되는 질환이다'라고 예측을 했는데 틀리면 -1점 이지만, '희귀질환이다'라고 예측했는데 틀리면 -0.5점으로 했다. 이렇게 안하면 '많이 발견되는 질환'으로 찍는 것이 유리하기 때문에 희귀질환을 못맞추는 것이 제대로 evaluation metric에 반영되지 않을 수 있기 때문
      image

    • 테리 생각
      : 사실 이 논문의 방법론이 매우 이론적으로 타당하거나 방법이 fancy해서 소개한 것은 아니다. 소개하고 싶었던 이유는 현실에서 발생하는 문제를 직접 접해보면 다양한 모델 아키텍쳐링을 하기 앞서 '문제 정의'와 '잘 예측했다'는 metric을 정의하는 것이 실제 문제를 푸는데엔 매우 크리티컬한 스텝임을 말씀드리고 싶었다.
      머신러닝에는 기본적인 classification 문제도 있고, 아주 많은 클래스를 classifcication 하는 문제도 있고, OOD detection 문제도 존재하지만, 현실에서 발생하는 문제는 딱 하나의 문제 카테고리로 정의되지 않는 경우가 많다. classification과 detection 사이, detection과 segmentation 사이의 문제도 많고, 문제를 어떤 뷰로 보느냐에 따라 데이터 레이블링 과정 자체를 컨트롤 해야하는 문제도 있고, weakly supervised로 풀어야 하는 문제도 있으며, 다른 도메인 데이터를 가지고 transfer learning을 해야할 때도 있다.
      많은 연구자분들이 정해진 문제에서 순위를 다투는데에만 힘쓰고, 이러한 논문을 보면 '뭐야, 시시한 방법 썼잖아'라며 무시하는 경우가 많은데, 실제 문제를 푸는데는 문제를 현명한 view로 바라보고 수학적으로 formulation 하며 제대로 된 evaluation metric을 적용해 "가장 간단한 모델을 적용해 보는 것"이 매우 큰 업적이라는 것을 말씀드리고 싶고, 그러한 현실 프로젝트를 기업과 많이 해보셨으면 하는 바람이다.
      덧) 피부 관련해 재밌는 문제와 데이터들 ART Lab 많이 있어요. 연락주세요 :) [email protected]

@nick-jhlee
Copy link

arXiv merchandise 추가정보

  • limited time! (12일 정도 남았네용)
  • Shipping: $12.99부터 시작, 하나씩 더 살 때 $4.5 정도씩 더.... -> 머그컵 기준
    (shipping이 역시 비싸네요,,, 근데 United States Postal Service가 shipping을 해서 어쩔 수 없는거 같기도,,)

Screen Shot 2022-02-20 at 10 46 06 PM

@hollobit
Copy link

hollobit commented Feb 20, 2022

원래는 이 가쉽 기사 소식도 다뤄 볼까 했었는데, 포브스에서 원소스 출처를 찾을 수가 없어서 소개하지 못했습니다. 남녀 커플 상태와 연애상담 예측을 해주는 인공지능이 나오면 대박일텐데 말이죠. https://www.itdaily.kr/news/articleView.html?idxno=206395

  • 결론이 특히 재미있습니다 - "총 100만 개가 넘는 데이터 포인트를 모두 입력했어도, 연애관계의 만족도를 높은 정확도로 예측할 수 없었다고 밝혔다. 뿐만 아니라 시간이 지날수록 변하는 만족도도 추적도 불완전했다"

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants