전체 글 19

[경제 서적] 부자아빠 가난한 아빠 ,부제: 친구아빠 따라 강남간다

회사 사수님의 추천으로 읽게 된 서적이다. 이 책을 읽고 당장 부동산 투자를 해야겠어!란 지식 전달이라기 보단, 투자란 무엇인가에 초점이 맞춰진 책인 것 같다. 그리고 일단, 자서전처럼 써 놓아서 술술 읽힌다는 장점이 있다. 처음엔 부자 아빠, 가난한 아빠라 기에 아빠가 두명이었나? 했는데 ㅎ 그냥 친구아빠였음.. 운 좋게 좋은 친구를 만나 어릴 때부터 투자 교육을 받다니,,,엄청난 행운 아닐까? 유대인은 12살부터 경제 공부를 시킨다고 한다. 직접 씨드머니를 주고 주식해보게 한다는데, 한국도 어릴 때부터 이런 실전에 투입하는 경제 교육이 있으면 얼마나 좋을까? 읽고 종종 생각 날때 읽으려고 정리해두었다. 부자가 되고 싶다면 돈에 대한 지식을 쌓아야 한다 우리는 누구나 쉽게 돈 벌고 싶어한다. 그러나 이..

카테고리 없음 2023.04.03

생물정보학 - scRNA analysis(2) : dimension reduction, clustering

이번엔 준비된 scRNA는 어떤 과정으로 분석하는지 작성해보고자 한다. scRNA computational analysis 과정은 다음과 같다. normalization → batch effect removal → dimension reduction → clustering → cell annotation이다 이번 편은 Dimension reduction을 왜 해야되는지, dimension reduction하는 방법 3가지에 대해 공유하고자 한다. #Dimension reduction 을 하는 이유는 25,000여개에 달하는 유전자들 중에서 중요한 유전자("HVG": highly variable genes)들을 뽑아내기 위해서이다. 많은 유전자들 중에선 zero-count인 유전자들이 많고 이 모든 유전자..

카테고리 없음 2023.03.19

scRNA (1) - techinques, 알아야 할 기본 용어, 분석 과정, 전처리법

※ Index 1. scRNA-seq 기본용어 2. scRNA 실험 techinques 3. scRNA 전체 분석 과정 4. 분석 방법: data preprocess(QC) → normalization → batch effect 나는 공부할 때 scRNA-seq이 RNA-seq보다 특별한 점이 뭐길래 쓰지? 란 관심을 가졌고, scRNA 데이터를 이해하기 위해선 scRNA 실험의 특징에 대해 이해할 필요를 느끼게 되었다. 실험을 통해 나온 scRNA-seq 데이터의 특징을 작성하고, 본격적으로 데이터를 분석하는 방법에 대해 공유하고 한다. #scRNA 기본 용어 scRNA 데이터를 알기 위해선 기본적으로 알아야 할 용어들이 있다. 바로 UMIs (Unique Molecular Identifiers)와 b..

카테고리 없음 2023.03.19

중외제약 c&c 최초합 후기 (기타 기업: 신한은행/LG CNS/대웅제약/마크로젠-합격여부 섞임)

나는 학사 건국대 생명공학계열, 석사 서울대학교 생물정보학을 2월에 졸업하여 6월부터 AI관련 bio platform을 제공해주는 스타트업에 입사하였고, 거의 2개월 후 바로 이직 준비를 하여 11월에 대기업 계열사로 이직하게 되었다. 이번 편은 그동안 겪었던 여러 기업 면접 혹은 시험 후기를 남겨보고자 한다. 남기고자 하는 기업은 다음과 같다 직무별로 분류하자면 생물정보학 회사로는 마크로젠, JW C&C와 현재 다니는 회사를 최초합되었고, IT직무로는 대웅제약 인턴 최합 Data analyst직무인 신한은행, LG CNS는 서류만 통과해 신한은행은 면접+코테+AI면접, LG CNS는 인적성+분석 테스트만 경험해보았다! 오늘 집중적으로 적을 내용은 경력직으로 이직한 중외제약이다! 중외제약 (JW C&C)..

카테고리 없음 2023.03.16

Clustering : Heatmap, K-means clustering, normalization, batch effect removal

목차: [1] Heatmap, Hirarchical Clustering [2] K-means Clustering [3] Normalization & Batch Effect Removal [1] Heatmap 유전자를 clustering한다는 것 = 다른 sample들 사이에 비슷한 expression profile을 가짐을 의미함 Sample들을 clustering한다는 것 = clustering을한 유전자들이 비슷한 expression profile을 가짐을 의미 Clustering을 하는 이유? 첫번 째, data 특징 혹은 실험 오류를 파악하는데 도움을 줌 → differential expression 두번 째, sample들을 classify하는 데 사용 가능 Cluster quality 평가하는..

카테고리 없음 2023.03.13

[Epigenetics] Transcription Factor & Motif - Expectation Motif, Gibbs Sampling

♣ Keyword: #Transcription factor : 전사 과정을 도와주게 하는 단백질 complex #Transcription motif : TF가 부착되는 위치들 (PWM matrix로 표현가능) #Position Weight Matrix : DNA sequnece의 어느 position에 A/T/C/G가 몇 퍼센트로 오는지 표로 만든 것 #Expectation Maximum : Algorithm으로 E step과 M step으로 구성된 방법 #Gibbs Sampling : 얘도 Algorithm (Markov Chain Monte carlo algorithm 중에 한 종류 (EM과 Gibbs Samping 방법론 중에 하나로 다른 데서도 다양하게 쓰임) 간단한 개요 (줄거리) DNA가 RN..

카테고리 없음 2023.03.11

DNA-sequencing multi-omics tool 'Varwalker' - develop version of Random walker

지속적으로 multi-omics가 성행하고 있음, DNA-sequencing 연장선으로 항상 multi-omics software에 관심이 많았는데 가장 유명한 random walk를 활용해 cancer driver gene을 찾는 Varwalker를 발견하게 되었음 2014년에 publish되었고 PLoS Comput Biol에 게재됨 논문 VarWalker: Personalized Mutation Network Analysis of Putative Cancer Genes from Next-Generation Sequencing Data PDF: https://pubmed.ncbi.nlm.nih.gov/24516372/ VarWalker란 무엇인가? VarWalker, to prioritize driv..

카테고리 없음 2023.03.05

Gene Set Enrichment Analysis - Gene Ontology 란 GSEA 란? -용도와 해석법

RNA나 DNA 데이터들을 통계 처리까지 완료 했다면 그다음은 나온 후보 유전자들을 어떻게 해석할 것인가를 분석해야 한다. 해석하는 과정에 있어서 많이 사용하는 방법은 Gene Ontology와 Gene Set Enrichment Analysis 두가지이다. 그래서 이번편에서는 1. Gene Ontology와 GSEA가 무엇인지, 2. 두 방법의 차이점, 가능하다면 다음편에 3. Gene Ontology에 많이 사용되는 tool 'DAVID' 사용법을 공유하고자 한다. Gene Ontology란? Gene Ontology는 예를 들어 RNA-seq 데이터로 DEG 분석을 시행하여 나온 관심 유전자들이 있을 것이다. 이 유전자들을 조사할 때 생물학의 어떤 pathway에 enrich되어 있고, 어떤 기능(..

카테고리 없음 2023.03.04

[RNA 분석] R 코드 실습 # DEG 분석과 결과 해석 # GEO database 사용법 # DESeq2

저번 글에 RNA-seq 데이터 전처리와 관련해 포스팅을 하였다. 이번편에서는 실제 논문을 따라한 예시 실습을 올리고자 한다. ※단 주의할 점은 이번편에 사용한 데이터는 #microarry data이다. 그치만, DEG 분석과정은 RNA-seq과 동일하게 시행하였다 (DEG 분석에 더 focusing하길) 이번편은 한마디로, #GEOquery tool을 사용해 GEO dataset을 뽑아내고 #DESeq2 tool로 DEG분석하는 법이다. 내가 simulation한 논문의 제목은 'Identification of DEGs-related prognostic risk model for survival prediction in breast carcinoma patients'이다. 논문 링크 ↓ https://..

카테고리 없음 2023.02.28