[논문 비교] optic + deep neural network

jiwoopapa (43)in #kr • 8 years ago

비교 대상 논문
- 논문 1: All-optical machine learning using diffractive deep neural networks (science, http://science.sciencemag.org/content/361/6406/1004)
- 논문 2: Hybrid optical-electronic convolutional neural networks with optimized diffractive optics for image classification (Scientific Reports, https://www.nature.com/articles/s41598-018-30619-y)

오늘은 논문 소개가 아니라, 비교(?)를 간단히 (정말 간단히, 난 물리라면 고등학교 아니 중학교때부터 1도 못 했으니..) 정리해 보고자 합니다.

그리 크지 않은 시간 차이를 두고 optical system으로 machine learning 특히 deep learning 시스템을 구현한 논문이 Science 그리고 Scientific Reports에 발표되었습니다. 뭐 실린 저널의 임팩트로 봤을 때는 너무 큰 차이가 있지만, 두 논문은 상당히 관련이 많이 있다고 생각합니다.

일단 1번 주자는 "All-optical machine learning using diffractive deep neural networks"이 시작했습니다. Ozcan 교수님 UCLA 교수로 현미경등 광학 영상에 딥러닝을 적용하여 Keyword 선점에 열을 올리고 있는 교수님인데, 이번에도 상당히 좋은 keyword를 선점했습니다. 광학의 회절 특징을 이용하여 optical 시스템으로 deep learning, 뭐 예로 든 것은 MNIST 같은 데이터베이스를 이용한 classification 문제를 푸는 시스템을 만들었습니다.

그럼 이걸 어떻게 만들었냐 하면 논문에 그림에 나오듯, 각 레이어의 값들을 정해진 웨이팅값을 곱해서 다음 레이어에 전달되도록 3D 프린터로 랜즈를 찍어냈습니다. 저도 고등학교에서 배운 기억으로는 물질을 통과하면서 회절도 그러지요. 그런 특성에 맞게 적당량의 빛이 정해진 정도로 다음 레이어로 갈 수 있도록 그걸 깍고 만들어 놓습니다. 그리고 그 빛을 받은 다음 레이어도 동일한 방식으로 깍고, 마지막에 각 클래스의 값들이 정해진 영역에 모이도록 해서 그걸 detector를 통해 받아 판단을 합니다.

이 때, 학습은 이미 이루어져서 파라미터들의 값은 알고 있고, 그걸 기반으로 찍어내기 때문에 이 논문에서 만든 diffractive deep neural network은 학습된 값을 infer만 할 수 있는 optical system이라고 보시면 될거 같습니다. 이걸 만들어 Science에 이름을 남깁니다.

그럼, 갑자기 또 "Hybrid optical-electronic convolutional neural networks with optimized diffractive optics for image classification"는 무슨 일인가 하실 수 있습니다. 왜 이놈은 또 diffractive optics란 비슷한 단어를 들이밀고 하는 일은 동일하게 image classification인가 하실 수 있습니다.

이 논문에서도 아래와 같이 광학계를 이용한 CNN을 구성합니다. 차이라면 Ozcan 그룹의 논문은 3D 프린터로 두깨들을 조절해 CNN의 각 레이어의 파라미터들을 조절했다면 이 논문은 Phase mask를 이용한다는 점입니다.

그런데 이 논문에서 정말 다른 점은 논문의 제목에서와 같이 "Hybrid optical-electronic"이라는 겁니다. 이미 Science 논문에서 All optical machine learning 시스템을 만들었다고 자랑을 했는데, 왜 이 논문은 뒷북을 치고 있나.. 그것도 optical에 electronic 을 굳이 Hybrid해 가면서...

문제는 non linear activation입니다. 논문에서는 non-linear activation과 fully connected layer라고 썼지만, 단순히 첫 논문에서 처럼 회절량을 조절하는 것만으로는 non linear activation layer을 구현하는건 거의 불가능에 가깝습니다. 그러나, 최근의 deep learning에서 .. 아니 조금 옛날 CNN에서 non-linear activation을 안 쓴 network은 흔치 않습니다. 소위 렐루라 불리는 ReLU, 그리고 그 파생상품들, 등등등이 다 nonlinear입니다. 이 논문은 이 부분을 광학계로는 해결하기 쉽지 않기에 그 부분은 광학계로만 하지 않고 electronic 기술을 접목해서 해결했습니다.

첫 논문은 광학계로만 해서 제한적인 기초적인 CNN을 한번 해 봤다!!가 주제이고, 두번째 논문은 그 논문은 힘들게 깍고 프린트하니 phasemask를 도입하고, non-linear activation이 지원 안 되니 hybrid 시스템으로 deep learning을 지원하는 optical을 만들었다!! 입니다.

그냥.. SNS을 통해 optical deep learning이 나왔다~!! 라고들 하시길레..

다른 분야처럼 이 곳도 갈길이 멀고, deep learning 전체가 아니라 옛날 lecun 아저씨 젊었을 때의 네트웍을 겨우 따라하고 있는 상황이니, 또 설레발을 넣어두시고 뭘 했고, 뭘 안 했는지 확인하는게 좋을듯 하여..

주말 밤 갑자기 생각나 글을 끄적끄적...

#ai #optical #deep #learning

8 years ago in #kr by jiwoopapa (43)

Sort:

jinsukim (48) 8 years ago

너무나 좋은 글 감사합니다!

$0.00

[-]

wakeprince (54) 8 years ago

항상 잘 보고 있습니다.

$0.00

[-]

codingman (64) 8 years ago

대개 논문이 기존의 방식에서 문제되었던 부분을 수정하고 개선시키는 방식을 취하거나 하면서 자신의 알고리즘을 부각시키는 경우가 많은 것 같아요.
그런데 재밌는 사실은 뒤북치거나 퇴보하는 실험논문들도 있다는 것이 참 재미있지요. 학회지 논문들을 읽다보면은 그런 경우가 종종 있지요.

$0.00

[-]