SAS数据分析基础到进阶 - Easy Career 公开课 [中文]

本視頻為試聽課,完整課程購買連結請點擊下方的連結Hello同學們大家好我是劉暢老師畢業於多倫多大學今天這個視頻我要給大家介紹一下什麼是SAS以及什麼樣的同學適合學習SASSAS作為一門統計軟件在數學、金融以及數據各個方面有一個非常廣泛的運用像我們熟悉的Excel它最多僅僅能夠處理15萬行數據而SAS適應現在big data的要求它可以處理很多很多的數據因此是很多金融機構願意去採用的一個軟件那麼SAS的國際認證包括兩個部分第一個是SAS的base國際認證第二個是SAS advanced國際認證兩個部分都是由選擇題和填空題組成一共有53道題目SAS的base你只需要答對70%而advanced需要答對65%就可以通過這個證書終身有效那麼什麼樣的同學適合學習SAS我們與其說SAS是一門編程軟件不如說它是對我們工作有用的一個工具性的軟件很多院校在開設這門課的時候都用R去取代了SAS因為SAS的成本非常非常高它是一門付費性的安全級別非常高的軟件以至於同學們在畢業找工作時發現簡歷上的要求全部都是SAS和C code那麼這時候呢這些同學又反過來要學習SAS因此你會發現SAS無論你是在學Stats和數學專業還是在學RC專業想進行data
analyzeHR的data analyze都需要的一門非常技能性的一個軟件他可以寫在簡歷上那麼在我的課堂中除了讓大家順利地通過兩個證書的考試我還和幾位data scientist一起設計了幾個非常實用的project大家可以寫在自己的簡歷上大家在以後面試的時候可以談起這個project那麼在整個課程結束之後除了你會收穫兩張國際認證的證書以外我們還會提供Easy Career的一個結課證書證明大家的學習能力而且我們還會提供五大行的導師推薦信幫助大家找到一份非常完美的工作好了那麼下面就請大家一起跟我走進我的SAS課堂好了同學們大家好
歡迎來到我們的SAS課堂今天這一節我們主要介紹一下SAS的基本概念首先大家可以看到SAS是一門統計軟件它可以用於和data相關的各個領域然後它也是排名第一的在很多金融機構比如中信銀行TD、還有很多通信商比如Rogers還有醫療機構都會廣泛地使用那麼SAS它的語句到底是什麼其實只有兩種第一種叫data step就是如何去跟數據相關的第二種叫做proc step就是對數據進行處理比如proc之後你可以sort進行排序比如PROC PRINT就是打印等等然後最後第三部分就是一個reporting的過程你最後要產生一個報告而這個部分就是與外部的接口比如說Excel比如說tableau這些可視化的報表相結合那麼這個就是SAS程序的一個特點所以我們也跟大家說SAS其實並不是一門編程語言大家不要把它想得那麼害怕它其實就跟Excel一樣是一個操作性的軟件所以學起來並沒有那麼痛苦下面我給大家看一下你以後的工作流程工作流程就是首先你要有一個data
base這個data base通常說都是我們買來的比如說你從Google從Oracle從Microsoft去買data你可以把它理解成在遙遠的山區他們有一個房間租了一個房間裏頭很多的數據庫然後我們從中去買一些data買來以後下面就是SAS必考的一道選擇題data的格式SAS可以認的是txt、csv還有SAS的data set得到這個data set以後呢我們可以做一些model比如我們統計分析里的regressionmachine
learning里的decision tree或者我們去產生一個report和tableau相結合大概就是這樣一個工作流程那麼下面我們學習一門軟件最重要的就是怎麼安裝這個我之前上課已經給它安裝好了今天我們來給大家講一講如何去導入一個數據這是做任何分析最關鍵的一步首先我們來看第一道選擇題是我們考試會遇到的它認的這個的形式這些形式它都可以認其中這個是SAS的形式那下面呢我們來講解一下如何去導入數據到SAS里這是它的基本語法大家看PROC IMPORTRUN所以SAS的code你不用去背因為它都是一段一段的我們說只有兩種第一種叫PROC RUN第二種叫DATA
SET只有這樣兩種那麼第一種呢PROC IMPORT里首先大家要把data file它所在的路徑寫上一會上機的時候我會教大家如何去複製一個文件的路徑接下來OUT是它要輸出的文件名字比如說你讀進去一個文件是A你希望一會兒再調用它是B所以你要寫出它讀出的名字接下來你要寫它的identifier就是它是什麼類型的文件然後如果是Excel表裏頭比如說有很多個表格你可以寫它的sheet name然後最後GETNAME=YES然後這個固定寫法那這樣我們就把整個data給它導進去了導進去以後我們可以給data做很多的manipulation有很多下面的function像我們base考試常見的就有keep比如說你導入的data一共有10行你想留住其中的某兩行就用KEEP去掉很多行就用DROPWHERE比如說有一列代表的是年齡你希望把年齡大於25歲的這些條打印出來所以WHERE代表selection代表篩選IF也可以表示篩選接下來邏輯邏輯有IF,THEN,ELSE然後最後我們會有一些missing
value比如說這個點或者是這個空格然後這裏想跟大家說的是在表示選擇的時候有WHERE和IF但是你以後實際在工作中希望大家多寫WHERE因為IF這個東西我們容易和IF,THEN,ELSE弄混然後下面我們教大家如何去運用這個DROP首先我們寫入DATA SET剛剛我們學的第一種叫PROC.RUN這是我們第一種code那麼第二種就是DATA SET.
RUNSET是原始的data你導進去的input比如說一個文件叫AAAA里一共有5個column現在你想把它第一個column去掉那麼大家去DROP如果它第一個column叫做H,就DROP age然後RUN一下就可以了然後接下來DROP還可以寫在SET的後面寫在SET後面要加括號加等號然後這樣呢給AA去掉了一列還剩4個column那得到一個新的數據比如說叫BB所以它不會破壞原始的data結構這就是我們說的這個語法的選擇然後下面我們就來帶大家看一下上次作業那我們今天的試講就到這裏了謝謝大家

標籤

健康,健康养生 猴棗散 迪士尼美語 -膠原BB ABC Juice health lose weight Abel Benson cat Clean beauty skin distance education Dragon Boat Festival Zongzi Financial Guru Chicken Ball Recipe Hifu療程 HK MC 激光脫毛 Ocean Park ohmykids PhD Piaget伯爵手表价格 PMS 月經 FSH SEO company universities Youfind 万国手表 中醫 乾紋 人生 企业培训 企业培训管理 企业教练培训 企业教练技术培训 教练技术培训 企业教练技术 企业文化 企业文化培训 培训 企业管理 培训课程 企业管理培训课程 课程 健康 养生 醫療 健康,健康养生 內分泌 冷凍光學 冷凍溶脂 凍肉 食品 勵志故事 化妝品 化妝水 半導體脫毛 半導體鐳射 卫浴 去斑效果 品牌 報警 失蹤 如新集團 娛樂 學習 室內設計 寶寶健康 寶寶飲食 小技巧 彩光嫩膚 愿景 个人培训 愿景个人培训 愿景诚信领袖培训 优势 护肤 保养 按摩 探索 推拉窗 換膚 教育 散文 文化 文化,學習 新型產品 鋁材 新聞 綜合 旅游 生活 旅遊 旅遊自然 旅遊項目 昆明 大觀樓 時尚 時尚購物 時評 替假 柏傲灣 the pavilia bay 柏傲灣呎價 柏傲灣示範單位 正本會 正能量 歷史 鋁窗 毛髮 民間 海藻矽 減肥 激光 激光祛斑 無創 無創拉皮 熱話 猴棗散 玉溪 撫仙湖 玻璃王座 白鳳丸功效 皮膚 皺紋 科技 租赁 競技 細白晶透光能面膜機 維修鋁窗 網上購物 緊致去紋 美容 美容療程 美白 美白牙齒 牙黃 美食 美麗 翻譯 肌膚 脫毛 脫毛法 膠原 膠原BB 膠原滋生 膠原自生 膠原蛋白 自資大學 航線 色斑 艺术 落地窗 蜕变七十 蜕变七十培训 補水 裝修市場 設計 維修 護膚 護膚產品 诚信领袖培训 个人修养 購物網站 跟團去歐洲 迪士尼美語 透明質酸 金箔面膜 金融 財經 鉆石能量水系統 互聯網 鋁窗維修 鋼具 鑽石能量水 鑽石能量水機 鑽石能量水系統 陶瓷 陶瓷十大品牌 陶瓷工艺品 陶瓷艺术品 邮票 随笔 面膜 领袖素质培训 養生 養陰丸 香港 香港商宏逸精品有限公司台灣分公司 香港迪士尼 马拉代尔 小说 骨骼健康资讯 高麗蔘 魔法軍團