Genetic algorithms(GA) vs generative models(VAE or GAN) by 바죠

Genetic algorithms (GA) vs generative models (VAE or GAN)

전통적인 유전 알고리듬(GA, 교차와 변이를 모두 사용하는 방법)의 보다 현실적인 사용법은 아래의 두가지를 포함하는 것이다. 
아래의 작업들은 전통적인 GA의 핵심 아이디어를 결코 훼손하지 않는다. 하지만, GA 계산 능력을 향상시킨다. 
대부분의 연구자들이 채택하는 현대적인 GA라고 볼 수 있다.
1. 국소최적화 적용,
2. 새로운 타입의 해를 도입하여 다양성을 확보 방법을 적용 [예를 들어, 기존의 우수한 해를 특정한 시간 이후, 강제로 제거시킴]

이렇게 향상된 탐색 능력을 가지는 유전 알고리듬(GA)은, 최근에 유행하는 딥러닝 분야에서 널리 제시된, 생성모델들(VAE, GAN, RNN, MCTS) 보다 더 좋은 해들을 제공할 수 있는가?
물론, 응용분야마다 결론은 다를 수 있다. 
이 질문에 아래 논문들은 답하고 있다.

인공지능 활용 분야에서 이 질문은 매우 중요한 위치를 차지한다. 
그 차이를 이론적으로 이해할 수 있을까?
이해 못해도 현상론적인 차이점을 알아내는 것만으로도 큰 가치가 있다.
왜냐하면, 이러한 연구는 인공지능 응용분야에서 어떠한 인공지능 가지로 진출하는것이 가장 적절한지를 평가할 수 있게 해준다. 
자신의 문제 풀이에 어느 방법이 더 적합한지 판단하는 것은 중요한 사항이다. 

특히, 차별자(neural network based discriminator)라고 할 수 있는 함수의 기능에 주목할 필요가 있다. 새로운 형식의 해를 찾을 수 있도록 도와 주는 장치이다. 물론, 인공 신경망을 활용하는 기법은 매우 진보된 방법이다. 차별자는 통상 특정한 함수로 정의할 수 있다.

Chem. Sci. 10, 3567 (2019).
https://pubs.acs.org/doi/10.1021/acscentsci.7b00572

“In terms of optimization performance, the best model is a genetic algorithm based on a graph representation of molecules”.

We find that the GA sequentially explores different parts of the 2D projection of the chemical space, finding different families of high performing molecules, while the discriminator prevents the algorithm from searching in the same space repeatedly.

neural network based discriminator

The task of the discriminator thus is to memorize families of high performing molecules and penalize their fitness to force the GA to explore different regions in chemical space.


\[ F(m) = J(m)+\beta D(m) \] . 

no discriminator 
\[ \beta=0  \]
Molecules with similar representation receive similar classification scores. Furthermore, long-surviving molecules are trained longer and receive weaker scores, resulting in decreasing fitness - reducing the chance of long periods of stagnation (illustrated
in Figure 2). The task of the discriminator thus is to memorize families of high performing molecules
and penalize their fitness to force the GA to explore different regions in chemical space.




유사 컨텐츠:
참고:


39개의 문자들이 순서대로 정확하게 'to be or not to be that is the question'이 될 가능성은 매우 많은 문자 배열들 중에서 특정한 하나에 해당한다. 얼마나 많은 가능성이 있는냐?

영문자 26개 더하기 1개의 빈칸(blank)를 고려하고 있다. 즉, 27개의 문자들을 허용하고 있다.
문장의 길이는 39이다.

\[ 27^{39} = 6.7 \times 10^{55} \] 

이렇게 많은 가능성을 가지고 있는 문자열들에서 하나의 문자열을 어떻게 찾을 수 있는가?

우선, 목적함수를 이용한다. 39점 만점이 되게 목적함수를 정의할 수 있다.
정해진 자리에 정확하게 정해진 문자가 있을 때, 1점을 준다.

위의 그림에서 처럼, 분자들을 문자열로 표현할 수 있다. 이것을 SMILES라고 한다. 
이렇게 하여 다양한 분자들을 표현할 수 있다.

400 nm 빛을 잘 흡수하는 분자들을 찾아낼 수 있다.
목적함수를 특정 파장으로 국한하고, oscillator strength 값이 큰 것들을 취급할 수 있게 한다.


핑백

덧글

댓글 입력 영역

최근 포토로그



MathJax