జీవ గణాంక శాస్త్రం
జీవ గణాంక శాస్త్రం (Biostatistics) అనేది సైన్స్ (science) లో ఒక భాగం. ఇది జీవుల గురించి అధ్యయనం చేయడానికి గణితం (mathematics) ను ఉపయోగిస్తుంది. దీనిని బయోమెట్రీ (biometry) అని కూడా పిలుస్తారు. ఈ రంగంలో పనిచేసే నిపుణులు జీవశాస్త్రం (biology), వైద్యశాస్త్రం (medicine), ప్రజారోగ్యం (public health) నుండి వచ్చే సమాచారాన్ని అర్థం చేసుకోవడానికి గణాంక శాస్త్రం (statistics) లోని పద్ధతులను వాడుతుంటారు. [1]
జీవ గణాంక శాస్త్రం శాస్త్రవేత్తలకు ప్రయోగాలు (Experiment) రూపొందించడంలో ఎంతో సహాయపడుతుంది. సమాచారాన్ని సేకరించడం, ఆ వివరాలను పరిశీలించడంలో ఇది కీలక పాత్ర పోషిస్తుంది. కొత్త రోగాలకు (disease) చికిత్సలు కనుగొనడానికి, ప్రజల ఆరోగ్యాన్ని కాపాడటానికి ఈ శాస్త్రం చాలా అవసరం. ఇది మెడికల్ స్టాటిస్టిక్స్ (medical statistics) కు చాలా దగ్గరగా ఉంటుంది.
చరిత్ర[edit | edit source]
ప్రారంభ అధ్యయనాలు, జన్యుశాస్త్రం[edit | edit source]
జీవ గణాంక శాస్త్ర చరిత్రకు జన్యుశాస్త్రం (Genetics) అధ్యయనంతో చాలా దగ్గర సంబంధం ఉంది. మొదట్లో తల్లిదండ్రుల నుండి పిల్లలకు లక్షణాలు ఎలా వస్తాయో తెలుసుకోవడానికి శాస్త్రవేత్తలు సంఖ్యలను ఉపయోగించేవారు. గ్రెగర్ మెండెల్ (Gregor Mendel) ఈ విషయంలో మొదటి వారిలో ఒకరు. ఆయన బఠానీ మొక్కలపై పరిశోధనలు చేశారు. కొత్త మొక్కలలో రంగులు, ఆకారాలు ఎలా మారుతాయో వివరించడానికి ఆయన గణితాన్ని వాడారు.
1900వ సంవత్సరం ప్రారంభంలో శాస్త్రవేత్తల మధ్య రెండు బృందాల మధ్య చర్చ జరిగింది. ఒక బృందం మెండెల్ పద్ధతులను అనుసరించగా, బయోమెట్రీ నిపుణులు అని పిలువబడే మరో బృందం ఫ్రాన్సిస్ గాల్టన్ (Francis Galton) ను అనుసరించారు. గాల్టన్ కు ఒక సిద్ధాంతం ఉండేది, దానిని "Law of Ancestral Heredity" (పూర్వీకుల వారసత్వ చట్టం) అంటారు. లక్షణాలు పూర్వీకుల నుండి చిన్న చిన్న భాగాలుగా అందుతాయని ఆయన భావించారు. విలియం బేట్సన్ వంటి ఇతర శాస్త్రవేత్తలు దీనితో ఏకీభవించలేదు. ఈ వాదన చాలా కాలం సాగింది. తర్వాత కాలంలో గణాంక నిపుణులు మెండెల్ ఆలోచనలు సరైనవని నిరూపించారు. ఇది ఆధునిక పరిణామ సంశ్లేషణ ఏర్పడటానికి దారి తీసింది.
చరిత్రలో ముఖ్యమైన వ్యక్తులు[edit | edit source]
గణితం ద్వారా ఈ రంగాన్ని నిర్మించడంలో ముగ్గురు ప్రముఖులు ఎంతో కృషి చేశారు:
రోనాల్డ్ ఫిషర్ (Ronald Fisher): గణాంక శాస్త్రం కోసం ఆయన ఎన్నో కొత్త పరికరాలను తయారు చేశారు. ఆయన Statistical Methods for Research Workers వంటి పుస్తకాలు రాశారు. Rothamsted Research లో బెట్టీ అల్లాన్ తో కలిసి పనిచేశారు.[2]
సెవాల్ జి. రైట్ (Sewall G. Wright): జంతువుల సమూహాలు కాలక్రమేణా ఎలా మారుతాయో ఆయన అధ్యయనం చేశారు. ఆయన inbreeding coefficient (అంతర్గత ప్రజనన గుణకం) ను రూపొందించారు.
జె. బి. ఎస్. హాల్డేన్ (J. B. S. Haldane): ఆయన "ద కాజెస్ ఆఫ్ ఎవల్యూషన్" (The Causes of Evolution) అనే పుస్తకాన్ని రాశారు. ప్రకృతి వరణం (natural selection) ఎలా పనిచేస్తుందో వివరించడానికి ఆయన గణితాన్ని ఉపయోగించారు.
కొంతమంది ప్రసిద్ధ జీవశాస్త్రవేత్తలు మొదట్లో గణితాన్ని వాడటానికి ఇష్టపడలేదు. థామస్ హంట్ మోర్గాన్ తన కార్యాలయంలో కాలిక్యులేటర్లు ఉండటం తనకు ఇష్టం లేదని ఒకసారి చెప్పారు. సంక్లిష్టమైన గణితం లేకుండానే తాను కొత్త విషయాలను (బంగారం వంటి ఆవిష్కరణలు) కనుగొనగలనని ఆయన నమ్మేవారు. [3]
పరిశోధన ప్రాజెక్టును ప్లాన్ చేయడం[edit | edit source]
విజ్ఞాన శాస్త్రంలో సరైన సమాధానాలు పొందాలంటే ఒక మంచి ప్రణాళిక ఉండాలి. ఈ ప్లాన్ తప్పులను తగ్గించడానికి సహాయపడుతుంది. ఒక పరిశోధన ప్రణాళికలో సాధారణంగా ఇవి ఉంటాయి:
స్పష్టమైన ప్రశ్న.
సమాధానం గురించి ఒక అంచనా (దీనిని హైపోథెసిస్ అంటారు).
ఆ అంచనాను పరీక్షించే పద్ధతి (experimental design).
సమాచారాన్ని (డేటా) సేకరించే విధానం.
సేకరించిన సమాచారాన్ని పరిశీలించే పద్ధతి.
పరిశోధన ప్రశ్న[edit | edit source]
పరిశోధనలో ప్రశ్న అనేది చాలా ముఖ్యమైన భాగం. ఆ అధ్యయనం దేని గురించి జరుగుతుందో ఇది అందరికీ చెబుతుంది. ఒక మంచి ప్రశ్న కొత్తగా, ఆసక్తికరంగా ఉండాలి. శాస్త్రవేత్తలు ఒక మంచి ప్రశ్నను ఎంచుకోవడానికి ముందు చాలా పాత పరిశోధన పత్రాలను చదువుతారు. [4]
హైపోథెసిస్ (పరిశోధన అంచనా)[edit | edit source]
హైపోథెసిస్ అంటే ఒక ఊహ లేదా అంచనా. ఇందులో ప్రధానంగా రెండు రకాలు ఉన్నాయి:
నల్ హైపోథెసిస్ (Null hypothesis - H0): ఈ అంచనా ప్రకారం ఎటువంటి మార్పు లేదా తేడా ఉండదు.
ఆల్టర్నేటివ్ హైపోథెసిస్ (Alternative hypothesis - H1): ఈ అంచనా ప్రకారం సమూహాల మధ్య తేడా ఉంటుంది.
ఉదాహరణకు, ఒక శాస్త్రవేత్త ఎలుకలకు రెండు రకాల ఆహారాలను ఇచ్చి పరీక్షిస్తే, "రెండు ఆహారాలు ఒకేలా ఉన్నాయి" అనేది నల్ హైపోథెసిస్ అవుతుంది. "ఒక ఆహారం రెండో దానికంటే మెరుగ్గా ఉంది" అనేది ఆల్టర్నేటివ్ హైపోథెసిస్ అవుతుంది.
శాంప్లింగ్ (నమూనా సేకరణ)[edit | edit source]
శాస్త్రవేత్తలు ప్రపంచంలోని ప్రతి ఒక్క వ్యక్తిని లేదా జంతువును పరీక్షించలేరు. అందుకు బదులుగా వారు ఒక చిన్న సమూహాన్ని తీసుకుంటారు. దీనిని శాంపిల్ (sample) అంటారు. ఈ సమూహం మొత్తం జనాభాకు ప్రతినిధిగా ఉండాలి. ఈ శాంప్లింగ్ అనేది చాలా పారదర్శకంగా, నిష్పక్షపాతంగా ఉండటానికి యాదృచ్ఛికంగా (random) చేయాలి. [5]
ప్రయోగాత్మక నమూనా (Experimental design)[edit | edit source]
పరీక్షలను నిర్వహించడానికి వేర్వేరు పద్ధతులు ఉన్నాయి:
పూర్తిగా యాదృచ్ఛిక నమూనా (Completely randomized design): ప్రతి వ్యక్తికి ఏదైనా గ్రూపులో చేరే అవకాశం సమానంగా ఉంటుంది.
రాండమైజ్డ్ బ్లాక్ డిజైన్ (Randomized block design): వ్యక్తులను ముందుగా కొన్ని సమూహాలుగా (బ్లాక్స్) విభజించి, ఆ తర్వాత పరీక్షిస్తారు.
రాండమైజ్డ్ కంట్రోల్డ్ ట్రయల్ (Randomized controlled trial): కొత్త మందులు ఎంత బాగా పనిచేస్తున్నాయో చూడటానికి వైద్య రంగంలో దీనిని ఎక్కువగా ఉపయోగిస్తారు.
సమాచార సేకరణ (Collecting data)[edit | edit source]
ఒక అధ్యయనం సమయంలో సేకరించిన వివరాలను డేటా లేదా సమాచారం అంటారు. ఇందులో రెండు ముఖ్యమైన రకాలు ఉన్నాయి:
గుణాత్మక సమాచారం (Qualitative data): ఇది సంఖ్యలతో సంబంధం లేని విషయాలను వివరిస్తుంది. ఉదాహరణకు "అనారోగ్యం" లేదా "ఆరోగ్యం". శాస్త్రవేత్తలు దీని కోసం సర్వేలు వాడుతుంటారు.
పరిమాణాత్మక సమాచారం (Quantitative data): ఇది ఎత్తు, బరువు లేదా కణాల సంఖ్య వంటి సంఖ్యలను ఉపయోగిస్తుంది.
వ్యవసాయం (Agriculture) లో శాస్త్రవేత్తలు ఒక మొక్క ఎంత ఆహారాన్ని ఉత్పత్తి చేస్తుందో కొలుస్తారు. జన్యుశాస్త్రంలో డి.ఎన్.ఏ (DNA) ను చూడటానికి యంత్రాలను ఉపయోగిస్తారు. ఈ సమాచారాన్ని అంతా ఒక పద్ధతి ప్రకారం దాచి ఉంచాలి.
సమాచారాన్ని వివరించడం[edit | edit source]
సమాచారం సేకరించిన తర్వాత, అది ఎలా ఉందో చూపించడానికి జీవ గణాంక నిపుణులు కొన్ని పద్ధతులు పాటిస్తారు.
పట్టికలు, గ్రాఫులు[edit | edit source]
పట్టికలు సమాచారాన్ని అడ్డు వరుసలు, నిలువు వరుసలలో చూపిస్తాయి. గ్రాఫులు సమాచారాన్ని చిత్రాల రూపంలో చూపిస్తాయి.
ఫ్రీక్వెన్సీ టేబుల్: ఏదైనా విషయం ఎన్నిసార్లు జరిగిందో ఇది చూపిస్తుంది.
లైన్ గ్రాఫ్: కాలక్రమేణా విషయాలు ఎలా మారుతున్నాయో ఇది చూపిస్తుంది.
బార్ చార్ట్: వేర్వేరు మొత్తాలను చూపించడానికి బార్లను ఉపయోగిస్తుంది.
హిస్టోగ్రామ్ (Histogram): ఒక పరిధిలో సంఖ్యలు ఎన్నిసార్లు కనిపిస్తాయో చూపిస్తుంది.
స్కాటర్ ప్లాట్: రెండు విషయాలకు సంబంధం ఉందో లేదో చూడటానికి ఒక మ్యాప్పై చుక్కలను ఉపయోగిస్తుంది.

సగటులు, వ్యాప్తి[edit | edit source]
సమాచారం యొక్క "మధ్య" విలువను కనుగొనడానికి శాస్త్రవేత్తలు గణితాన్ని ఉపయోగిస్తారు:
సగటు (Mean): అన్ని సంఖ్యలను కలిపి, అవి ఎన్ని ఉన్నాయో ఆ సంఖ్యతో భాగించాలి.
మధ్యగతం (Median): ఒక వరుసలో మధ్యలో ఉండే సంఖ్య.
బాహుళకం (Mode): అన్నిటికంటే ఎక్కువసార్లు వచ్చే సంఖ్య.
| రకం | ఎలా లెక్కించాలి | ఉదాహరణ ఫలితం |
|---|---|---|
| సగటు (Mean) | అన్నిటినీ కలిపి భాగించాలి | 4 |
| మధ్యగతం (Median) | మధ్య సంఖ్యను కనుగొనాలి | 3 |
| బాహుళకం (Mode) | ఎక్కువగా వచ్చిన సంఖ్యను చూడాలి | 3 |
ముగింపులు తీసుకోవడం (Inference)[edit | edit source]
Statistical inference అంటే ఒక చిన్న నమూనాను ఉపయోగించి ప్రపంచం మొత్తంలో ఏమి జరుగుతుందో అంచనా వేయడం. దీనిని ఈ క్రింది పద్ధతులతో చేస్తారు:
హైపోథెసిస్ టెస్టింగ్: సేకరించిన డేటా మన అంచనాకు మద్దతు ఇస్తుందో లేదో తనిఖీ చేయడం.
కాన్ఫిడెన్స్ ఇంటర్వల్స్ (Confidence intervals): నిజమైన సమాధానం ఉండటానికి అవకాశం ఉన్న సంఖ్యల పరిధి.
పి-విలువ (P-value): ఫలితాలు కేవలం అదృష్టం కొద్దీ వచ్చాయా లేదా అనేది ఈ సంఖ్య చెబుతుంది. పి-విలువ చాలా తక్కువగా ఉంటే (సాధారణంగా 0.05 కంటే తక్కువ), ఆ ఫలితం "ముఖ్యమైనది" అని అర్థం. అంటే అది అదృష్టం వల్ల రాలేదని అర్థం.
బిగ్ డేటా మరియు కంప్యూటర్లు[edit | edit source]
గతంలో జీవ గణాంక పనులను చేతితో చేసేవారు. ఇప్పుడు DNA sequencing మరియు వైద్య రంగం నుండి మనకు చాలా ఎక్కువ సమాచారం లభిస్తోంది. దీనిని "బిగ్ డేటా" (Big Data) అని పిలుస్తారు.
హై-త్రూపుట్ డేటా[edit | edit source]
కొత్త యంత్రాలు ఒకే సమయంలో వేలకొద్దీ జన్యువులను పరీక్షించగలవు. దీనిని హై-త్రూపుట్ అంటారు. సమాచారం చాలా ఎక్కువగా ఉన్నందున, గణాంక నిపుణులు అందులో నిజమైన సమాచారాన్ని (signal) గుర్తించి, పనికిరాని సమాచారాన్ని (noise) వదిలివేయాలి. Principal component analysis వంటి పద్ధతులు బిగ్ డేటాను సులభంగా అర్థం చేసుకోవడానికి సహాయపడతాయి.
బయో ఇన్ఫర్మేటిక్స్[edit | edit source]
బయో ఇన్ఫర్మేటిక్స్ (Bioinformatics) జీవసంబంధిత సమాచారాన్ని భద్రపరచడానికి, అధ్యయనం చేయడానికి కంప్యూటర్లను ఉపయోగిస్తుంది. శాస్త్రవేత్తలు తమ పనిని పంచుకోవడానికి పెద్ద డేటాబేస్లు ఉన్నాయి. కొన్ని ఉదాహరణలు:
PubMed: శాస్త్రీయ పత్రాలను వెతకడానికి ఒక ప్రదేశం.
KEGG: జన్యువులు, రసాయనాల కోసం ఒక డేటాబేస్.
Gene ontology: జన్యువులు ఏమి చేస్తాయో వివరించే పద్ధతి.
ఈ డేటాలో నమూనాలను కనుగొనడానికి శాస్త్రవేత్తలు Machine learning (మెషిన్ లెర్నింగ్) ను ఉపయోగిస్తారు. ఇది కొత్త మందులను కనుగొనడానికి లేదా వ్యాధులు ఎలా వ్యాపిస్తాయో అర్థం చేసుకోవడానికి సహాయపడుతుంది.
జీవ గణాంక శాస్త్రం ఎక్కడ ఉపయోగపడుతుంది?[edit | edit source]
జీవ గణాంక శాస్త్రం జీవితంలో చాలా చోట్ల ఉపయోగపడుతుంది:
ప్రజారోగ్యం మరియు వైద్యం[edit | edit source]
ఎంతమందికి జబ్బులు చేస్తున్నాయో అర్థం చేసుకోవడానికి ఇది నిపుణులకు సహాయపడుతుంది. ఏదైనా వైరస్ వ్యాపించినప్పుడు, అది ఎక్కడికి వెళ్తుందో గణాంక నిపుణులు గమనిస్తారు. కొత్త మందులు ప్రజలకు సురక్షితమేనా అని తెలుసుకోవడానికి వారు Clinical research లో కూడా సహాయం చేస్తారు.
వ్యవసాయం (Agriculture)[edit | edit source]
రైతులు, శాస్త్రవేత్తలు మంచి పంటలను పండించడానికి ఈ శాస్త్రాన్ని ఉపయోగిస్తారు. మొక్కలు పెద్దగా పెరగడానికి లేదా తక్కువ నీటితో బతకడానికి కారణమయ్యే జన్యువులను వారు వెతుకుతారు. దీనిని Plant breeding (మొక్కల ప్రజననం) అంటారు.
జీవావరణ శాస్త్రం (Ecology)[edit | edit source]
ప్రకృతిని అధ్యయనం చేసేవారు జంతువులను, మొక్కలను లెక్కించడానికి దీనిని ఉపయోగిస్తారు. జంతువులు అంతరించిపోతున్నాయా (Extinction) లేదా అని చూడటానికి ఇది ఉపయోగపడుతుంది.
ముఖ్యమైన సాఫ్ట్వేర్ సాధనాలు[edit | edit source]
జీవ గణాంక శాస్త్రం కోసం చాలా కంప్యూటర్ ప్రోగ్రామ్లు సహాయపడతాయి:
R: ఇది చాలా మంది శాస్త్రవేత్తలు వాడే ఉచిత ప్రోగ్రామ్.
SAS: దీనిని పెద్ద కంపెనీలు, ఆసుపత్రులు ఉపయోగిస్తాయి.
Python: దీనిని మెషిన్ లెర్నింగ్, డేటా అధ్యయనం కోసం ఉపయోగిస్తారు.
Orange: డేటాను చూడటానికి సులభమైన ఇంటర్ఫేస్ కలిగిన సాధనం.
Weka: డేటాలో నమూనాలను కనుగొనడానికి దీనిని వాడతారు.
విద్య మరియు జర్నల్లు[edit | edit source]
చాలామంది కళాశాలలో ఉన్నత స్థాయిలో జీవ గణాంక శాస్త్రాన్ని చదువుతారు. వారు సాధారణంగా ప్రజారోగ్యం లేదా వైద్యం పాఠశాలల్లో దీనిని నేర్చుకుంటారు. నిపుణులు తమ పరిశోధనలను ప్రచురించడానికి చాలా ప్రత్యేక పత్రికలు (జర్నల్స్) ఉన్నాయి. కొన్ని ప్రసిద్ధమైనవి:
Biostatistics
Biometrics
Statistics in Medicine
అంశాల సారాంశ పట్టిక[edit | edit source]
| అంశం | అది ఏమి చేస్తుంది |
|---|---|
| జన్యుశాస్త్రం (Genetics) | లక్షణాలు ఎలా వారసత్వంగా వస్తాయో అధ్యయనం చేస్తుంది. |
| క్లినికల్ ట్రయల్స్ | కొత్త మందులు పనిచేస్తాయో లేదో పరీక్షిస్తుంది. |
| ఎపిడెమియాలజీ | ఒక సమూహంలో వ్యాధులు ఎలా వ్యాపిస్తాయో అధ్యయనం చేస్తుంది. |
| బయో ఇన్ఫర్మేటిక్స్ | డి.ఎన్.ఏ ను చూడటానికి కంప్యూటర్లను ఉపయోగిస్తుంది. |
ఇవి కూడా చూడండి[edit | edit source]
Mathematical and theoretical biology
మూలాలు[edit | edit source]
- ↑ Lua error in Module:Citation/CS1/Configuration at line 2213: attempt to index field '?' (a nil value).
- ↑ Lua error in Module:Citation/CS1/Configuration at line 2213: attempt to index field '?' (a nil value).
- ↑ Lua error in Module:Citation/CS1/Configuration at line 2213: attempt to index field '?' (a nil value).
- ↑ Lua error in Module:Citation/CS1/Configuration at line 2213: attempt to index field '?' (a nil value).
- ↑ Lua error in Module:Citation/CS1/Configuration at line 2213: attempt to index field '?' (a nil value).