创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
创造营2020撑腰榜前三名分袂是 希林娜依·高、陈卓璇 、郑乃馨足交 twitter
芳华有你2官方榜(35进20)前三名分袂是 刘雨昕、虞书欣、喻言
得分95.23,来自《创造营2020》的黄若元(依然告别舞台)
得分93.773,来自《创造营2020》的孙珍妮(当今位列撑腰榜第19)
创造营2020的姑娘姐有籍贯记载的41位中,来自四川的有7位,江西、浙江、湖南和湖北的各3位
欧美成人电影芳华有你2姑娘姐来自最多的省市分袂是北京、台湾 各9名,重庆、成齐各6名
以下是举座数据部分截图(Spyder变量检察器)
因为整合的信息较多,共17个字段,我们在作念分 数据猜想 统分的技艺只需要用到部分即可。 在作念统计分析时,这里中枢即是一个 分组统计 (df.groupby())。
2.1姑娘姐降生地分散《创造营2020》姑娘姐官方信息数据中,降生地惟有41/101个,且多以省为标尺,我们统计恶果如下:
《芳华有你2》姑娘姐官方数据比拟全,降生地有108/109,且多以市为标尺,我们统计恶果如下:
2.2姑娘姐的降生年份分散降生年份我们吞并数据作念妥洽惩处吧,一共有160/210份数据,我们统计恶果如下:
2.3姑娘姐星座分散星座分散我们吞并数据作念妥洽惩处吧,一共有168/210份数据,我们统计恶果如下:
2.4姑娘姐身高分散身高分散我们吞并数据作念妥洽惩处吧,一共有137/210份数据,我们统计恶果如下:
身高这种属性,我们还不错作念浅薄的描写统计分析如下:
(不错看到,最高175cm,最低158cm,平均167.12cm,中位数168cm)
2.5姑娘姐体重分散体重分散我们吞并数据作念妥洽惩处吧,一共有120/210份数据,我们统计恶果如下:
身高这种属性,我们还不错作念浅薄的描写统计分析如下: (不错看到,最高87kg???,最低40kg,平均48kg,中位数48kg)
飞速查一下这个87KG的妹子是谁,看了下相片,嗅觉是官网数据填错了吧,应该47kg省略87斤?才对吧,算了不改了~
因为腾讯云ai评分,过百的就有40来个,我们照旧用Face++吧
颜值评分这个因为是精准到了少量点后3位,是以我们在作念统分的技艺,更合乎先进行分箱操作
2.6.1女性角度颜值评分先看描写统计分析恶果:
(不错看到,最高95.23,最低65.596,平均83.742,中位数84.837)
颜值按照60-100每10分一个档位,我们统计恶果如下:
90分以上颜值的确高达16位~
2.6.2男性角度颜值评分先看描写统计分析恶果:
(不错看到,最高93.77,最低66.404,平均82.606,中位数83.482)
颜值按照60-100每10分一个档位,我们统计恶果如下:
90分以上颜值的确惟有6位~【难谈男性对颜值的条目更高???】
三、载入需要的库 3.1使用requests+json得到姑娘姐列表通过F12在开导者界面Network—>XHR中我们不错发现真确数据苦求地址(见Headers里的General),以及苦求反应的数据步伐 是 json。
参数不错在Headers里的Query String Parameters 里找到
于是我们不错编写以下代码进行数据爬取
3.2使用requests+xpath得到姑娘姐基础信息 四、使用requests调用api接口得到姑娘姐颜值评分一驱动我用的是腾讯云的东谈主脸识别,跑完数据发现101个创造营姑娘姐里有21个颜值得了满分,而我可爱的一个姑娘姐朱主爱的确得分最低,那奈何行。是以,本次我们新增了旷视的FACE++东谈主脸识别作念颜值评分对比。
4.1腾讯云东谈主脸识别腾讯云东谈主脸识别需要使用到第三方库tencentcloud-sdk-python
在进行调用的技艺,需要先加载策动包
#腾讯云东谈主脸检测与分析 #检测给定图片中的东谈主脸(Face)的位置、相应的面辖下性和东谈主脸质料信息 #位置包括 (x,y,w,h) #面辖下性包括性别(gender)、年齿(age)、颜料(expression)、魔力(beauty)、眼镜(glass)、发型(hair)、口罩(mask)和姿态 (pitch,roll,yaw) #东谈主脸质料信息包括举座质料分(score)、模糊分(sharpness)、光照分(brightness)和五官遮拦分(completeness)
在第一次使用云 API 之前,用户领先需要在腾讯云规则台上申问候全凭据,安全凭据包括 SecretID 和 SecretKey, SecretID 是用于象征 API 调用者的身份,SecretKey 是用于加密签名字符串和职业器端考据签名字符串的密钥。SecretKey 必须严格撑握,幸免表露。
由于我们只需要年齿和颜值评分,因此创建函数时只需要复返age和beauty两个字段即可。
4.2Face++东谈主脸识别接口调用很浅薄,建树好你需要的苦求参数(这里我们聘用年齿和颜值:age,beauty),由于Face++颜值评分分为男女视角下的颜值分两种,是以我们需要复返三个值:年齿、男/女视角颜值分。
具体函数见下方:
到此这篇对于Python爬虫之爬取2020女团选秀数据的著述就先容到这了足交 twitter,更多相关python爬取女团履行请搜索剧本之家往时的著述或不时浏览底下的相关著述但愿全球以后多多支握剧本之家!
您可能感意思意思的著述: Python爬取股票信息,并可视化数据的示例 Python爬取数据并终了可视化代码融会 python怎样爬取网站数据并进行数据可视化 高考要来啦!用Python爬取积年高考数据并分析 光棍狗福利?Python爬取某婚恋网征婚数据 Python爬虫之自动爬取某车之家各车销售数据 Python爬虫之爬取某文库文档数据 python爬虫之教你怎样爬取地舆数据 Python爬虫实战之爬取京东商品数据并实终了数据可视化