생정보학 기본원칙과 철학

생정보학을 하는데 필요한 기본생각들 (First Principles First)
현재의 한국사회의 많은 것들이 그 원래의 목적에 꺼꾸로 가는 현상이 벌어진 것 같다. 과장된 것 같지만, 우리가 무슨 일을 할때 진짜로 무엇을 원하는 가를 계속 생각하지 않으면 그 원래 목적 자체를 손상할수도 있게 된다. 그래서 사람이 무슨 일을 할때는 철학이 필요하다. 이런 철학적 사고의 필요는 목적과 원래 취지를 생각하고 그것에 정직하게 행동하려는 노력을 뜻한다. 그래서 생정보학을 하는 것도 원칙에 입각한 사고가 필요하다. 그것이 자기 자신의 생각체계에서 독립적으로 쌓아 올린 것이면 가장 좋고, 다른 사람들에게서 가져온 것이라도 좋다.
생정보학을 하려면, 사회, 과학, 공학, 기술 및 생물학에 관한 관심과 체계적인 생각이 있어야 한다. 철학은 기초적 질문을 하는 것을 포함하고, 생정보학을 하려면 그런 질문을 먼저해야 한다. 좋은 질문을 찾는 행위는 과학에서의 첫번째 단계이다. 그것은 기술이고 반드시 질문을 찾는 구체적 방법을 익혀야 한다.
과학을 할때는 항상 윤리적인 질문도 해야 한다. 윤리의 핵심은 인간 사회와 같은 생명적 네트워크를 형성하는 무리에서 그 무리의 생존 효율에 얼마나 최적화인가 하는 것이다. 그래서, 우리가 과학을 할때, 왜, 옆방의 실험자의 데이타나 아이이어를 훔쳐서 자기 것인양 이용하거나, 동료들의 성과를 무시하는 행위를 하면 안되는지는 우리가 속한 생정보학사회를, 더 나아가서는 인간사회, 동물사회, 지구위의 생명사회에 궁극적으로 더 효율적인가 아닌가의 기준에 따라 판단해야한다. 이것은 종교적인 옳고 그름과는 다른 매우 실학적인 실용적인 생각이다. 그러면 생정보학의 목적은 무엇인가?

생정보학의 목적 (The purpose of bioinformatics)
생정보학의 최종목적은 생명의 모든 현상을 정보적, 체계적으로 이해하는 것이다. 그럴려면, 지구상의 모든 생명체들이 어떤 여정을 걸어와서 현재와 같은 복잡한 정보처리객체들을 이루었는가를 분석하는 것이 필요하다. 생명체가 걸어온 길을 현재까지 우리는 진화라는 개념으로 보편적으로 이해하고 있다. 그래서, 진화는 생물학과 생정보학에서 가장 중요한 이론적 분석 방법론이다. 생물학에서 진화는 증명된, 법칙에 가까운 이론이다. 진화의 중요성은 그것이 상태의 변화들을 시간의 축에서 잘 설명이 되기 때문이다. 그러면 시간이란 무엇인가?

생정보학에서의 시간의 중요성. (Time is important in Bioinformatics)
시간이 실제하는 것인가 아니면 하나의 편리하나 개념인가는 과거 유럽의 중요한 철할문제였다. 나는 시간이라는 것이 우주에서 물질적으로나 에너지적으로 실존하는 것이 아니라고 생각한다. 그것은 가상적인 일종의 도구라고 생각한다. 시간을 생물학을 연구하는 데 매우 중요한 도구이고, 시간개념에서 진화의 개념이 가능하고, 진화는 생물학에서 거의 유일하다시피한 원칙이 되었다.

생정보학적 상호작용 Interaction in Bioinformatics
생물학에서 가장 중요한 데이타의 자원은 각종 상호작용나, 상호작용의 네트워크이다. 생물학 맨 밑바닥의 정보는 분자나 원자들의 상호작용에서 나온다. 상호작용이 없으면 네트워크도 없고 복잡함도(complexity) 없다.

생정보학의 두가지 중요한 변수: 에너지와 정보 (Two factors of life: energy and information)
생정보학에서 가장 중요한 두가지 변수는 에너지와 정보이다. 세포내에서 에너지의 양이 어떻게 조절되는가와 어떤 정보가 조절되는가가 생명체의 생존을 결정짓는다. 비유적으로 말하면 먹을 에너지가 있어야 되고 그것을 활용하여 지속적으로 에너지를 구할수 있는 정보가 있어야 한다. 예를 들면 대장균이 에너지를 냄새맡고(정보) 그쪽을 향해가기 위해 ATP라는 분자를 써서 화학에너지를 사용하는 것이다. 생물세포내에서 이런 에너지와 정보를 처리하는 가장 핵심 부품은 단백질이다. 그래서 지구에서 생명현상를 연구한다는 것은 단백질을 연구한다는 것과 근본적으로 같은 것이다.
그러므로, 이 생정보학책은 단백질연구를 중심으로 한 생명정보 처리를 필연적으로 많이 다룬다.

Everything went against its purpose at some point of human development unless it has been since the emergence of human society. An exaggeration? Maybe, however lack of thinking on what we really want in any of our actions often result in hurting the very purpose of the action. That is why some philosophical thinking is necessary on whatever we do. Some people attribute this faithfulness to objectives to honesty. Likewise, any good understanding of Bioinformatics requires some fundamental thoughts either by yourself or acquired from others. I think any proper bioinformatics research requires such philosophical thoughts on society (network of beings), science, engineering and biology. Philosophy asks questions such as what life is, why we live, why we are interested in biology, what is the purpose of living, why I read this book, and so on. Conscious and subconscious perception of the above questions and efforts for good answers become the foundation for other less serious questions on society, science and biology. I interpret ethics as a means of optimizing productivity in any biological network such as a human society. Therefore, we need to ask some ethical questions as well in performing science. For example, why we should not steal other scientists’ research work and have to be fair and non-political to the authors of submitted papers for publication. Or matters such as why we should allow human cloning.

The final purpose of bioinformatics is a systematic understanding of the all the processes of life. This requires us to know how the life on Earth took certain path to achieve the high degree of complexity we experience everyday. Because of this evolution is perhaps the most important problem domain in bioinformatics.

I do not think time exists as a natural component or essence in the universe, however, it is a necessary and useful measurement method (an axis in a graph) to research biology. Time axis leads to evolutionary study, which is one of the rare principles in biology.

Perhaps the most important data source in biology is various interactions, or networks of interactions. The ultimate source of data in biology is molecular interactions such as protein-protein interactions. No interaction means no network and no complexity.

Two very important biological parameters: Energy and Information. There are two most important parameters in biology. They are energy and information. Biology is an information science working on very complex control and regulation systems mainly dealing with energy flow. Biology can be boiled down to all the phenomena and problems derived from the interaction of the two entities. It results in certain architectures of information processing. For example, a protein structure can be viewed as an information representation of energy. In this view, the whole body of evolutionary development on Earth can be viewed as an intricate architecture of energy and information. The architecture occupies distinct coordinates in space and time. It is not entirely random or accidental. It exists in the space under clear physical rules. One of the fundamental objectives of bioinformatics is to model the architecture of life recorded in the individual organisms on Earth. The records are genomes, cells, organisms and networks of them.
