मुझे पता है कि यह सांख्यिकीय निष्कर्ष को गंदी करेगा, लेकिन मैं वास्तव में केवल एक सटीक मॉडल के करीब होने के साथ ही चिंतित हूं जैसा कि मैं कर सकता हूं। मेरे पास एक द्विपातिक परिणाम चर है, जिसमें बड़े पैमाने पर द्विपातिक अनुमान लगाए गए हैं। मैं सोच रहा हूं कि मैं अपने मॉडल में कौन-से वेरिएबल को शामिल करना चाहिए चुनने के लिए LASSO का उपयोग करने की कोशिश करना चाहता हूं, फिर एक चयनित तर्क को एक लॉगमिट प्रतिगमन में इनपुट करना चाहिए। क्या इस बात की अनदेखी है कि जब इस दृष्टिकोण की व्यावहारिकता की बात आती है, तो 26 जनवरी को 21:35 पहले पूछा गया, तो यह कोई गारंटी नहीं है कि एक रैखिक संभावना मॉडल लॉज मॉडल का अनुमान लगाएगा, जिसके परिणामस्वरूप एक के लिए चुने गए वेरिएबल्स का सबसेट हो सकता है दूसरे के लिए कम उपयुक्त दूसरा, फिर से फिटिंग किसी भी संकोचन पर कोई भी लागू नहीं होता है, भले ही चरम चयन के दौरान गंभीर गलत-कैलिब्रेशन एंपेप को खतरे में डालते हुए भेदभाव का थोड़ा नुकसान हो। आप किसी विशेष डेटा-सेट पर प्रक्रिया को मान्य करने में सक्षम हो सकते हैं, लेकिन यह सामान्य रूप से सुरक्षित नहीं दिखता है, या किसी चरण-योग्य रिक्तिगत प्रतिगमन पर कोई लाभ देने के लिए। और बेशक, इसके अनावश्यक लासॉस एल 1-मानदंड का जुर्माना रिक्तिगत प्रतिगमन में संकोचन एम्प चयन के लिए इस्तेमाल किया जा सकता है। उत्तर 27 जनवरी 15 13: 56 मुझे भ्रम और कठिनाई हो रही है, जो एलएलएलएसओएसओएस के साथ glmnet का उपयोग कर रही है, जहां मेरे ब्याज का परिणाम द्विपातिक है मैंने नीचे एक छोटा सा फर्जी डेटा फ्रेम बनाया है: उपर्युक्त डेटासेट में कॉलम (वेरिएबल्स) निम्नानुसार हैं: उम्र (साल में बच्चे की उम्र) - निरंतर लिंग - बाइनरी (1 नर 0 महिला) बीएमपीपी (बीएमआई प्रतिशत्य) - सतत मेडु (उच्च शिक्षा स्तर की मां) - क्रमशः (उच्च विद्यालय 1 हाईस्कूल डिप्लोमा 2 स्नातक की डिग्री 3 पद के स्तर की डिग्री से कम) पेडु (पिता उच्च शिक्षा स्तर) - क्रमवक्ता (मेडु के समान) fcolor (पसंदीदा प्राथमिक रंग) - नाममात्र ( नीले, लाल, या पीले) अस्थमा (बच्चा अस्थमा की स्थिति) - बाइनरी (1 अस्थमा 0 नहीं अस्थमा) इस उदाहरण का लक्ष्य 6 संभावित भविष्यवाचक चर की सूची से बच्चा अस्थमा की स्थिति का अनुमान लगाए जाने वाला मॉडल बनाने के लिए लाससो का उपयोग करना है ( उम्र। लिंग। बीएमआईपी मेडु पेडु। और फ़ेकलर)। स्पष्ट रूप से नमूना आकार यहां एक मुद्दा है, लेकिन मुझे उम्मीद है कि विभिन्न प्रकार के चर (यानी निरंतर, क्रमिक, नाममात्र और बाइनरी) को glmnet ढांचे के भीतर कैसे संभाल लेंगे जब परिणाम द्विआधारी होता है (1 अस्थमा 0 अस्थमा नहीं) जैसे, किसी को भी इस मूर्खतापूर्ण उदाहरण के स्पष्टीकरण के साथ-साथ अस्थमा की स्थिति का अनुमान लगाने के लिए उपरोक्त आंकड़ों के साथ एक नमूना आर स्क्रिप्ट प्रदान करने के लिए तैयार रहना चाहिए, हालांकि बहुत बुनियादी, मुझे पता है, और संभवतः कई अन्य सीवी पर, 8 अक्टूबर 13 को 15:56 लाइन एक्सफैक्टर्स लेफ्टिनेंट - मॉडल। मेट्रिक्स (अस्थमा लिंग मेडु पेडु फॉलल), - 1 कोड को स्पष्ट वैरिएबल फेकॉलर (जैसा कि पिछले लाइनों में एएक्टर द्वारा घोषित किया गया है)। यह डिफ़ॉल्ट आर डमी चर कोडिंग का उपयोग करना चाहिए, जब तक कि contrasts. arg तर्क प्रदान नहीं किया जाता है। इसका मतलब यह है कि सभी रंगों के रंगों को समान रूप से भारित और गैर-दिशात्मक, पहले एक को छोड़कर, जो संदर्भ वर्ग के रूप में उपयोग किया जाता है और अवरोधन में अवशोषित होता है। ndash एलेक्स 27 अक्टूबर 15 5:16 पर
No comments:
Post a Comment