国产亚洲精品福利在线无卡一,国产精久久一区二区三区,亚洲精品无码国模,精品久久久久久无码专区不卡

當(dāng)前位置: 首頁 > news >正文

WordPress電影公司網(wǎng)站主題大連網(wǎng)站建設(shè)費用

WordPress電影公司網(wǎng)站主題,大連網(wǎng)站建設(shè)費用,果洛州wap網(wǎng)站建設(shè)公司,大連 模板網(wǎng)站時隔一個多月,終于想起來寫大數(shù)據(jù)算法基礎(chǔ)的實驗報告,主要是快截止了,hh 這兩天加急把這個報告寫完了~ 接下來,寫一寫證明過程(參考書籍:高等教育出版社《數(shù)據(jù)科學(xué)與工程算法基礎(chǔ)》)主要代碼以…

時隔一個多月,終于想起來寫大數(shù)據(jù)算法基礎(chǔ)的實驗報告,主要是快截止了,hh

這兩天加急把這個報告寫完了~

接下來,寫一寫證明過程(參考書籍:高等教育出版社《數(shù)據(jù)科學(xué)與工程算法基礎(chǔ)》)主要代碼以及總結(jié)體會o(* ̄▽ ̄*)ブ


本次實驗主要設(shè)計三塊內(nèi)容,分別是水庫抽樣算法(當(dāng)水庫大小為1時),水庫抽樣算法(當(dāng)水庫大小為k>1時)以及分布式水庫抽樣算法


水庫抽樣算法

主要證明過程

主要Python代碼?
水庫抽樣算法(返回一個)
import randomdef sampling_single(stream):reservoir = stream[0]i = 1for i, item in enumerate(stream):j = random.randint(0, i)if j < 1:reservoir = itemreturn reservoir F = [i for i in range(100)]H = sampling_single(F)
print(f"Randomly sampled element: {H}")
水庫抽樣算法(返回多個)?
import randomdef reservoir_sampling(stream, k):reservoir = []for i, item in enumerate(stream):if i < k:reservoir.append(item)else:j = random.randint(0, i)if j < k:reservoir[j] = itemreturn reservoirdata_stream = [i for i in range(100)]sampled_data = reservoir_sampling(data_stream, 10)

分布式水庫抽樣算法?

?主要證明過程

? 一個Hadoop任務(wù)Sample由 n 個 Map 組成,其中每個 Map 都接受到一個數(shù)據(jù)流 Substream,當(dāng)這些數(shù)據(jù)無法完全保存在內(nèi)存時,如何隨機地抽取一個含有 k 條記錄的樣本(每條記錄被抽中的概率相同),于是,這就引出了分布式水庫抽樣算法(分層水庫抽樣 + 重抽樣 = 分布式水庫抽樣算法)

? 先在每個 Map 上獨立運行水庫抽樣算法,之后對 n 個子樣本就行重抽樣,獲得滿足要求的最終結(jié)果。?

主要 Python 代碼?
import randomdef reservoir_sampling(stream, k):reservoir = []for i, item in enumerate(stream):if i < k:reservoir.append(item)else:j = random.randint(0, i)if j < k:reservoir[j] = itemreturn reservoirdef distributed_sampling(n, k, stream):N = []F = []H = []for i in range(n):F.append(reservoir_sampling(stream, k))N.append(len(F[i]))total_N = sum(N)for j in range(k):p = random.random()m = 0cumulative_N = 0while cumulative_N < p * total_N :cumulative_N += N[m]m += 1H.append(random.choice(F[m-1]))return Hn = 15
k = 10
data_stream = [i for i in range(100)]
H = distributed_sampling(n, k, data_stream)
print("Final Sample H:", H)   

總結(jié)?

? 水庫抽樣技術(shù)歸根到底就是在總體容量未知的情況下,僅通過單遍掃描數(shù)據(jù)集便能生成等概率抽樣集合的一種均勻抽樣技術(shù)。

? 代碼或許很簡單,但是其中的數(shù)學(xué)知識以及思想方法是很值得學(xué)習(xí)的!

http://m.aloenet.com.cn/news/28429.html

相關(guān)文章:

  • 包頭市建設(shè)工程安全監(jiān)督站網(wǎng)站萬能搜索引擎入口
  • 東莞網(wǎng)站優(yōu)化微信公眾號運營推廣方案
  • 滾屏網(wǎng)站模板網(wǎng)站生成器
  • 分類網(wǎng)站一天做幾條合適百度平臺客服電話
  • 50個辦廠好項目運城seo
  • 網(wǎng)站正能量晚上免費軟件愛站網(wǎng)為什么不能用了
  • 網(wǎng)站建設(shè)技術(shù)分為哪些方向電子商務(wù)營銷的概念
  • 哪個公司做網(wǎng)站最好深圳百度競價排名系統(tǒng)
  • 有服務(wù)器域名源碼怎么做網(wǎng)站平臺sem投放
  • 如何建立微網(wǎng)站詳細(xì)seo優(yōu)化操作
  • 網(wǎng)站怎么做讓PC和手機自動識別品牌策劃方案ppt
  • 撫寧區(qū)建設(shè)局網(wǎng)站5188關(guān)鍵詞平臺
  • 做網(wǎng)站常州網(wǎng)站建設(shè)網(wǎng)站定制
  • 哈爾濱建站在線咨詢做好網(wǎng)絡(luò)推廣
  • 大連網(wǎng)站建設(shè) 領(lǐng)超最好電商運營公司排名
  • 基于web網(wǎng)上花店網(wǎng)站設(shè)計論文鄭州好的seo外包公司
  • 廣州網(wǎng)站建設(shè) 易點寧波seo關(guān)鍵詞優(yōu)化
  • 做網(wǎng)站百靈鳥網(wǎng)站建設(shè)產(chǎn)品介紹
  • 鄭州疫情最新數(shù)據(jù)消息界首網(wǎng)站優(yōu)化公司
  • 寶塔做的網(wǎng)站能不能訪問網(wǎng)址seo查詢
  • wordpress文章序號排列百度seo優(yōu)化策略
  • 唐山建設(shè)工程造價信息網(wǎng)站自己創(chuàng)建網(wǎng)站
  • 佛山網(wǎng)站建設(shè)的首選搜索引擎優(yōu)化方法總結(jié)
  • jquery做背景的網(wǎng)站賞析制作網(wǎng)頁鏈接
  • 做動物網(wǎng)站的原因是推廣什么軟件可以長期賺錢
  • 濮陽房產(chǎn)網(wǎng)站建設(shè)品牌營銷和市場營銷的區(qū)別
  • 做網(wǎng)賭網(wǎng)站得多少錢十個有創(chuàng)意的線上活動
  • 網(wǎng)站抓取優(yōu)化優(yōu)化步驟
  • 網(wǎng)站建設(shè)基礎(chǔ)教程人教版seo培訓(xùn)網(wǎng)
  • 哪個網(wǎng)站可以做結(jié)婚請柬女生seo專員很難嗎為什么