Skip to content

Non-small cell lung cancer diagnosis project through DNA sequence analysis

Notifications You must be signed in to change notification settings

woody35545/BioInformatics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Predict non-small cell lung cancer using DNA sequence

[보유 Sequence Data]

index 1 - 1342 까지 비소세포폐암 환자 (1341 개)
index 1342 - 2542 까지 일반인 (1201개)

약 120명의 비소세포폐암 환자 데이터와 Reference Sequence를 증폭하여 만든 120명의 정상인 데이터가 원본 데이터(약 240개)를 구성함.
원본 데이터에 노이즈를 추가하는 방식으로 (Data Augmentation) 증폭하여 총 2542개의 학습용 데이터로 구성하였음.

[학습에 사용된 데이터]

환자 1200명, 일반인 1200명

2400개의 DNA Sequence Data를 한번에 학습하기에는 GPU Resource 관련 Issue가 발생하여서, 단계당 800명 데이터를 이용하여 3단계로 나눠서 학습하였음.(진행중)

1st train: 환자 400명 + 정상인 400명

index: (1 ~ 400) + (1343 ~ 1742)   

2nd train: 환자 400명 + 정상인 400명

index: (401 ~ 800) + (1743 ~ 2142)  

3rd train: 환자 400명 + 정상인 400명

index: (801 ~ 1200) + (2143 ~ 2542)  

About

Non-small cell lung cancer diagnosis project through DNA sequence analysis

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published