- 2022-08-13 发布 |
- 37.5 KB |
- 42页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
基础统计学讲义
基礎統計學\n基礎統計不連續Vs.連續資料母體Vs.樣本測量位置–眾數、中位數、平均數測量延伸和變化–全距、變異數樣式–長條圖(直方圖)常態分佈及機率–Z值柏拉圖分析一致性–流程圖圖解工具敘述練習圖解分析和描述統計結果2\n兩個主要測量指標:連續的vs.不連續的指標連續測量連續指標可以分割成更細的小片斷不連續量測不連續的指標一般代表分類也可以代表計數時間自然測量成本#事件主觀評價缺點/沒有缺點計數量測是/否量測分類你能將時切分割多細?3\n連續vs.不連續量測:範例持續(變異)不連續(做/不做或是類目)黏質Go/NoGo檢驗資料pH晴天vs.陰天化驗準時vs.遲到濃度污點(是/不是)不純度結束時間不連續(計算)錢每個樣本之污點數融化流動速率缺點數微粒大小錯誤數每一週失敗次數4\n練習:連續vs.不連續量測10分鐘在一個教室練習用下一頁不連續資料在測量的工作表定義例子持續和/或是不連續資料討論結果目標教學區別連續和不連續的量測5\n行動–連續性的vs.不連續資料量測的例子6\n連續不連續$$稀少的富有的資訊連續vs.不連續資料:哪一個比較好的?去獲得相同階層了解關於一種流程……哪一個比較好的?依據問題而言如果連續性是一種通則,則此類資料適用連續型有些連續測量是無法獲得的…不要作假資料!7\n母體vs.樣本統計敘述參數(使用於母體)母體:某群體中所有個體的量測資料的集合敘述參數是被用來描述母體推論統計學樣本:從某一母體中取出部分其量測資料的集合推論統計學:乃是從一樣本的量測值來推測母體的特性Canyounameapopulation?Canyounameasamplefromthatpopulation?母體樣本?8\n統計從數據中萃取到的資訊:最小值最大值百分位數,25th,50th,75th總和計數良率不良率甚麼是"統計"?Arethereanyothercommonlyusedstatisticsnotlistedabove??9\n統計學VS.母體特性統計學用於估計母體特性12.415.216.409.218.715.432.614.219.108.510.706.3SAMPLEPROCESSPOPULATION母體樣本製程10\n在隨機的產出中,是不可能完全正確的去預測何時及何事會產生出來我們可以做的是去決定這些數值發生的次數預測的頻率SampleMeasurementFrequency11\n重要的母體特性主要的總體特徵:位置離散程度分佈的形狀一致性12\n位置的量測:眾數(Mode)及中位數(Medium)衆數一組測量值的衆數的定義是出現次數最多(頻率最高)的測量值如果將此組資料用直方圖或點圖來表示的話,則最高的柱條或堆疊區間的中心點即爲衆數中位數一組測量值的中位值其定義是當測量值按大小順序排列時所取的中間數13\n位置的量測:集中趨勢算術平均數(或平均數)平均數是母體中所有可能的值的總和除以母體內的總個數母體平均數用希臘字母m來表示樣本平均數用X來表示,並且用?平均數和中位數之間的差別是什麽?估計14\n練習計算每一樣本的平均數、中位數及眾數暗示:使用Excel來驗證你的計算結果這些資料檔已由ThreeDataSets.xls提供和教師一起將這資料貼到Minitab.用Minitab確認您的結果Xi’sXi’sXi’s10781612119011714108131110121110161191210956121111nSXbarMedianModeThreeDataSets.xls15\n分散度量測:全距全距全距是一組量測資料中最大值與最小值的差有利條件:非常容易計算不利條件:考慮兩個資料:5,6,6,7,7,7,8,8,9Range=(9-5)=45,5,5,5,5,5,5,5,9Range=(9-5)=4只取兩個資料為考量可能會誤導實際資料的分散度Range=(9-5)=416\n分散性量測:變異數測量變異數母體變異數(s2)變異數是與平均值的平均平方離差除以母體的總個數估計母體變異數(s2)將平均平方離差之總和除以(n-1)而不是n,用以代表母體變異數之無偏誤之估計值17\n練習由資料去估算母體標準XX-Mean(X-Mean)2101697810109912nSXbars2sDrawthedeviationsforeachXiinfigurewithinthenotessection.用Excel和Minitab證明你的答案18\n形狀:樣式頻率HOWOFTENMEASUREDVALUE19\n形狀:以直方圖分析變異數資料是一個頻率直方圖顯示哪些特定的種類之出現的頻率由直方圖可以很快的分析:資料的常態性製程的集中程度分散度分配的形狀0123456789101112567891011121314每月週期20\nShape:InterpretingHistograms對稱雙峰型非對稱分離物扁平型21\n型式:常態分配(連續性資料)在統計之機率分配中最重要的是常態分配(a.k.a.,theGaussiandistribution).只要m和s被指定,則整個曲線即被決定了22\n計算Z-值這個“transform”轉換任意的常態分配(給一個樣本的平均數和樣本變異數)至標準正常化分配,此標準化常態分配之平均數=0,變異數=1.Z值(或是Z-score),代表的是某一特殊x與樣本平均值的距離,此距離單位則為標準差.舉例來說,如果Z=2,則某一特定x與樣本平均數的距離為2個標準差預測缺點的情形,(或是估計不良率),則使用規格上限與下限來取代x這樣,我們可以用樣本平均數及變異數來計算產品超出規格的比例TheZ-變換:()()sxx-xz-=-=sm23\n常態分佈機率68%95%99.7%曲線下的面積就等於概率24\n舉例–常態機率當z值<2時,其機率值可能為何?當z值>2時,其機率值可能為何?當z值<-1時,其機率值可能為何?25\n練習背景:親愛的Abby:您寫在您的專欄上一般女子懷孕的天數為226天.這是誰說的?我懷我的小孩共10個月加5天,這是無庸置疑的,因為我知道這確切的資料是為我的小孩所構想的.我的丈夫在Navyand他不可能很多時間為我設想週到因為我見到他一次只有1小時,以前ㄥ下這小孩前我不想再看到他.我沒有喝酒或是到處亂跑,當然不是為了小孩子,所以請列印出來取消那266天運送的的時間我也曾經有過這樣的問題.--SanDiegoReaderAbby’s回信:親愛的Reader:平均懷孕週期在266天.有些嬰兒會早產.有些會晚到.您的是晚來了.--Abby統計上所觀察資料:我們所觀察到的懷孕時間是X,約310天.而且,醫學資料顯示懷孕的期間平均數(m)是266天;標準偏差約(s)是16天.問題:10個月加5天大約接近310天,此女人懷孕是會超過平均數44天.在這些資料的我們知道懷孕週期的變異數時間(在哪些案例接受女人的要求),或是這是合理的推論是在SanDiego讀者沒有告訴這個事實?你需作何種假設來回答這問題?CourtesyoftheUniversityofTennessee.26\n1009080706050403020100形狀:柏拉圖表用以分析屬性資料遞減式長條圖依據柏拉圖原則對問題列出其優先順序27\n柏拉圖表當最初柏拉圖表的分析無法產生柏拉圖原則,則必需使用工具將資料先做層別以顯示問題中顯藏的細節NumberofComputerProblemsbyDepartmentJune–SeptemberRateofProblemsbyDepartmentJune–SeptemberLostTimeDuetoProblemsbyDepartmentJune–SeptemberNumberofProblemsbyTypeJune–September28\n一致性(Consistency)Time?相對於時間何者有最高的一致性29\n一致性:推移圖用以分析變異資料隨時間觀察其績效以發掘其趨勢及性徵管制圖的基礎#ofDaystoApproveDateApplicationReceived30\n一致性:解釋連續圖表移動折線相同的價值31\n圖解工具…………….Rachel:Paul–Ilonawantsnotesoneveryslide.Whatwouldyoulikethemtosay?\n箱型圖TimeProcessStep分析變異的資料顯示不同小族群的資料(階段,運轉,etc.)在分配上的差異33\n說明箱型圖表時間ProcessStep連續不斷的變化DiscreteVariableTop25%ofthedataUpperMiddle25%ofthedataMedian34\n層別–箱型圖您可以看出輸出從哪一些不同的表?Shift6Shift5Shift4Shift3Shift2Shift1603010Downtime-Minutes35\nDotPlot36\n階層的形成–多樣-雜亂的表哪一個層別因素會影響到Y?37\n散佈圖#缺點(Y)Speed(X)用於分析變異的資料顯示出兩個變數之關係並不顯示出兩者之間的因果關係38\n顯示A與B存在一個正相關的關係,當B增加A亦增加顯示A、B間存在一個負相關之關係當B增加,A會相對減少A與B之關係無證據以顯示其關係ABBBAA散佈圖的說明39\n投石車練習建立一個Set-up程序以3~4人為一組來執行每一個會拿總數量是20shots(一次10個,重複兩次).量測投射距離至0.5“單位使用粉狀/鋁/箔/帶子如果您認為它們會減少您的測量和shooting變異數(注意–他們是需要錢!!)每一資料是英呎(小數)您的目標是84+/-6inches.您可以練習shots但您需要成本!打開Excel文件使用“statapultdatacollectionsheet.xls”這個檔案去收集您的資料從你的組員的投射記錄計算:平均數、中位數、眾數全距,標準差良率%(以在規格內次數除以總投射次數)誰是您組內最好的shooter?在您的流程裡顧客最需要的是甚麼?您怎麼會知道?Storeyourdataforlater.40\n投石車資料的收集&計算(舉例)41\n圖解分析投石車結果和您的講師:分享您的statapultExcel檔案與您團隊中夥伴及講師開啟一個新的Minitabcopy您的statapult結果從Excel到Minitab工作表以直方圖表示將60個投射資料執行敘述統計(並產生圖形)對每一點shooter做點圖對shooter作箱形圖依據反複次數作點圖依據投射者及反覆次數作多變數圖對所有的投射作一管制圖依據投射者、反覆次數、投射次數將資料分類對投射者作一管制圖在析這些圖表後你是否更了解這些流程?Storeyourdataforlater.42查看更多