原创 服老思和同学们 P话 来自专辑数据周报
去年七夕,我们整理出一份��七夕脱单指南,今年,我们在此基础上增加 4 份七夕商业数据报告、12 份数据作品以及 5 份数据表白攻略,按照单身、恋爱、分手、婚姻四个类别整理。
七夕的背景

七夕,又名乞巧节、七巧节,是发源于中国周朝时期的一个传统节日,最早可追溯至春秋战国时期。当时的七夕主要源自古人对天文的崇拜和敬畏,为祭祀牵牛星、织女星。直到汉朝以后,这一节日开始与牛郎织女一年一会的浪漫爱情故事联系起来,但也并非传统意义上未婚男女定情的情人节。在古代,七夕最重要的活动是“乞巧”,因为传说中织女心灵手巧,未婚女性便会在这一天穿针乞巧,祈求巧艺以及美满姻缘。
直到 21 世纪,在商家的推广下,七夕节慢慢被赋予“中国版情人节“的意义。
2006 年 5 月 20 日,七夕节被国务院列入第一批国家非物质文化遗产名录。
七夕什么时候变成“中国情人节”的?
七夕在古代并不是情人节,“七夕 = 情人节” 这一概念是 21 世纪以来才被大力推广并成功得到认可。是谁第一次提出七夕是中国情人节这一概念?这一概念怎样得到推广和发展最终被大众熟知并接受?
在河南师范大学文学院张海艳的论文《传统节日文化的大众传媒解读——从七夕到“中国情人节”》提到,最早建议七夕为“中国情人节”的公开言论可追溯到 1993 年,由当时的中宣部副部长徐惟诚提出,但这一言论在当时并没有引起激烈的反应;直到2006 年夏季, 全国各地以及多家有影响力的媒体围绕“七夕节”举办大规模情感类活动和节目,这推动“七夕‘和”中国情人节“在民众广泛认知中产生了更紧密的链接。
经过调查, 笔者所看到的给七夕“穿靴戴帽”封为“中国情人节”的最早建议是:在1993年, 当时的中宣部副部长徐惟诚提出:“何不搞一个中国的`情人节' ?” 1993年3月11日的《报刊文摘》, 转摘了当年《时事报告》第2期所刊登的徐惟诚的报告, 其中说到:“我们的传统节日, 有许多被淡化了, 没有过去那么热闹了, 这似乎不太合算;农历七月初七牛郎织女相会, `在天愿作比翼鸟, 在地愿为连理枝' , 这是白居易写唐明皇与杨贵妃在七月七日长生殿的誓词。为什么不可以把这一天当作中国的情人节, 省得小青年去过外国的情人节。”
2006 年夏季, 全国各地围绕传统的“七夕节”, 兴起了炒作“中国情人节”的热潮, 有7家媒体(集团)办起了主题活动。其中以江苏广电总台的“七夕红豆· 东方情人节”最为引人注目。
来源:传统节日文化的大众传媒解读——从七夕到“中国情人节”
为何是在 2006 年开始大力庆祝七夕节?这是由于在 2006 年 5 月 20 日,七夕节经国务院批准列入第一批国家级非物质文化遗产名录。
另外,根据百度百科、知乎网友Herman和某匿名用户的介绍,七夕节第一次作为“中国情人节”出现时名为“红豆七夕节”,2001 年由红豆集团创始人周耀庭想出,它最初的出现更多的是商业考量,服装公司江苏红豆集团想借此新形象打开年轻人的市场。红豆公司对此大力推广,从 2001 年至今,每年都会举办晚会、游园会等一系列活动;还连续多年和央视联手举办央视七夕晚会。

https://zh.wikipedia.org/wiki/%E4%B8%83%E5%A4%95
那么,在大众的认知中,七夕和情人节是什么时候开始被紧密联系在一起的呢?
根据 Google Books Ngram Viewer 的简体中文语料库,建国以来,“七夕”和“情人 节”(这里工具自动将“情人节”转换为“情人 节”进行查找)是上世纪九十年代后期开始才被频繁在图书中使用的。尤其是到 2014 年,“七夕”一词的使用急剧上升,在使用频率上甚至超过了“情人节”。


参考百度指数,同样发现和 Google Trends 类似的趋势:

各国情人节怎么过?
世界性的情人节通常是 2 月 14 日,也有说法认为一年 12 个月每月 14 号都是情人节,每个情人节各自的名称和含义。而在中国传统文化中,七夕是牛郎织女相会的日子,也是近年较为广泛接受的“中国情人节”。
除了玫瑰和烛光晚餐,不同国家也有不同表达爱意的方式。譬如在南非,女子会把心爱的人名字写下来,别在袖口;在沙特阿拉伯,人们禁止过情人节,且禁止公开作出亲昵行为,否则会引来法律制裁。

��情人节过节指南:吸猪到德国,单身狗去芬兰
工具
—
程序员的浪漫 - 一周年主题网站
程序员前辈 hackerzhou 算是用程序表白的先驱人物,2011 年他用 jQuery + HTML5 写给自己妹子一个庆祝相恋一周年的纪念网站,当时引起了很多人的关注。

作者整理代码在GitHub上创建了一个名叫 Love 的项目,供有兴趣继续开发的朋友们继续开发:https://github.com/hackerzhou/Love
原作者博客:http://hackerzhou.me/2011/11/programmers-romantic-1st-anniversary-website.html
这个浪漫的程序表白故事最后并没有一个完美的结局,网址也从 http://love.hackerzhou.me变到http://hackerzhou.me/ex_love/,现在已经都失效。但有网友沿着这个思路仿照写一个类似的网站:

源码:https://github.com/moevis/lative
http://moevis.github.io/flower-love/
这位网友还开发了一个“What Is My Girlfriend Thinking ?”的小程序,是一个使用 Tensorflow.js 和 Angular 搭建的用于表情分类的小应用,主要通过摄像头会实时分析图像,并给出最大的类别概率。
源码:https://github.com/moevis/what-is-my-girlfriend-thinking
Python版程序员表白代码
如果你觉得上面的程序员表白方式有点复杂,而又刚好在学 Python 的话,这里有几段 Python 表白代码。

在 Tableau 中绘制心形曲线
在 3 月 P话发布的 ��Tableau 数学驱动艺术 文章中,提到了如何使用 Tabelau 中的公式功能绘制新型曲线。虽然流传很广的笛卡尔和瑞典公主的故事是人们虚构出来的,但笛卡尔心形曲线公式本身就已经足够浪漫。

另外,知乎问题“写一个什么样的程序向喜欢的妹子表白?”下有很多有趣的答案:
https://www.zhihu.com/question/274711258/answer/396428664
譬如:
给 知乎用户 Random Forest 给女朋友量身订做的小海豚电子宠物��

https://www.zhihu.com/question/63254750/answer/216306361
譬如一个 3D 的心形��

https://www.zhihu.com/question/28044068
还有几年前曾经一度很流行的不同学科表白法:
如何用各学科专业知识高大上地表白?
知乎匿名用户搬运自果壳论坛,原文已经失效。但还有知乎链接可以参考。
https://link.zhihu.com/?target=http%3A//www.guokr.com/post/67216/

单身
—
美国单身图鉴
作者 Soma 是哥伦比亚新闻学院的数据可视化专家,他致力于做各种数据可视化的尝试,而上面的美国 singles map 就是他的成名作,拖动滑块你会发现单身男女的比例随年龄的增加变化,你想知道和你同龄的美国人的单身情况吗?��

在魔都捕获高富帅
如何在魔都捕获你的“高富帅”白马王子?!城市数据网出品的“魔都脱单指南”,以 TalkingData 提供的数据为基础,分析“魔都高富帅”最爱出现的区域,参加的娱乐活动,出现频率最高的行动轨迹等......
下图左边为标注了所有房价均价均价在6万元/平方以上的一手房加上五星级酒店和酒店式公寓,共计有 70 个高档住宅小区和 150 个酒店的魔都地图。右图为上海市纳税超过 10 亿元的企业和租金 top20 的顶级写字楼的分布图。

年轻人的恋爱观
根据各国政府公布的统计数据显示,德国单身人口达 54%;16 岁以上美国人 50.2% 是单身。《2018中国统计年鉴》数据显示:2017 年中国全国单身人口规模达到 2.4 亿,占总人口约 17%;国家统计局和民政部数据显示 2018 年结婚率仅为 7.2‰
谷雨数据和镝次元整合各方数据,探讨为何选择结婚的年轻人越来越少。

今年上半年,“虚拟恋爱”爆红,谷雨和数可视爬取哔哩哔哩相关视频下的弹幕评论,探讨为何“虚拟恋爱”受到年轻人追捧?看别人恋爱时,大家都在想些什么?

全国各地酒吧指南
DT财经以CBNData《2017天猫酒水线上消费数据报告》为基础出品这份酒吧报告,看来成都有名的不止美女,还有酒吧。各位单身狗不妨查看各城市的酒吧地理分布图,在浪漫的七夕夜来一场美丽的邂逅吧。

香港各区男女比例
这是 ODHK & CODE4HK 于 2014 年合作的一个开放数据项目。基于 2011 年的香港人口普查数据,按地域或者指标进行可视化,上图就是香港各区男女比例的地图。这下,便知道哪里能偶遇的概率最大了吧。

恋爱
—
恋爱图谱
你还记得历任男/女友的恋爱时长吗?作者 Robin 把自己的所有恋爱都记录下来,画成了一个互动的图。老外分得很细致, dating 和 seeing 都不一样,可视化记录下自己每段恋情的时长,第一次约会的时间。有的是一见钟情,有的是分分合合,还有一天约会两人的。而作者使用的约会网站,21 岁之前,多是 OkCupid,后来有了 Reddit、Meetup、Tinder 等等,仿佛见证了这波互联网约会的发展。

这个女生的首页也很赞,用可视化的记录了自己过去十多年的经历,每一项经历都可视化到时间轴上。几十年后回望这张包含自己重要人生轨迹的可视化图表,也是一件很幸福的事情。

哪两种职业最般配?
U.S. Census Bureau’s 2014 American Community Survey 以 350 万个家庭作为调查对象 ,作者利用调查结果,探究伴侣选择和职业的关系,发现冥冥之中职业和伴侣的选择也有联系!女性 CEO 倾向于与其他 CEO 结婚,男性程序员的伴侣多是老师......

When sparks fly- 藏在短信里的心跳
作者把和潜在另一半的短信都记录下来,而 “ Right Man ” 的每一条短信自然都用粉色的小球进行可视化,满屏跳动的粉色圆圈大概就是少女砰砰砰的心跳��

纽约爱情地图
纽约客出品的“纽约爱情地图”。以 482 个分布在纽约的爱情故事为起点,收集读者的“纽约爱情故事”,并将这些故事标注在纽约地图上。读者可以提交自己在这个城市里经历过的爱情故事:第一次相遇在哪个酒吧、第一次约会在哪家饭店等等。将鼠标滑动到不同的光标上,可以看到在地图这个地点发生的故事。另外,还可以设置故事发生的时间和类型,查看指定类别的故事。

从 Facebook 数据看“爱的形成”
2014 年情人节,Facebook 以在 2010 年 4月 11 日至 2013 年 10 月 21 日期间宣布结婚的夫妇发帖数量为基础,探究两人关系的转变如何影响他们在社交媒体互动情况。
从下图可以看到,在恋爱关系开始之前的 100 天内,潜在恋爱者间分享的帖子数量缓慢但稳定地增加。但在确定关系后,帖子数量开始减少,可以猜测,确定关系的恋爱者更倾向于现实世界中的更多互动,从而减少在线互动。


https://www.facebook.com/data/posts/10152217010993415
https://www.facebook.com/notes/facebook-data-science/the-formation-of-love/10152064609253859
婚姻
—
干得好,真的不如嫁得好吗?
网易数读以女性在婚姻中满意度的社会调查数据为基础,探究女性在婚姻中的满意度和哪些因素有关。
根据 2010 年全国妇联和国家统计局联合发布的《第三期中国妇女社会地位调查全国主要数据报告》,即使到 2010 年,超过六成的受访者依旧有“男主外女主内“想法,这一比例相比 2000 年的调查结果甚至更高。

有学者利用 2003 至 2013 年中国综合社会调查(CGSS)中16-55岁已婚女性的数据,发表论文 Does Marrying Well Count More Than Career? Personal Achievement, Marriage, and Happiness of Married Women in Urban China,探讨中国城市已婚女性个人成就以及婚姻幸福的影响因素。
研究发现,在丈夫处于高收入阶层的情况下,无论女性本身的阶层如何,幸福感均较高。整体来看,女性的平均幸福得分会随着丈夫的阶层地位的下降而下降。

2017年,第一批“00后”已经开始相亲了
2017 年,第一批 00后 年满 17 岁,但网上已经出现了不少有关“00后奇葩相亲帖的内容”。网易数读深入常常被提及的“00后”相亲发源地——00后早恋吧、00后处对象吧、05后早恋吧,爬取 2.3 万个帖子,经过数据清洗后,我们得到了22696个“相亲帖”,探讨这些 00后 的网络相亲“恋爱观”。
数据显示,“颜控”、“声控‘和”个子高“位居女对男外貌要求的前三位;而”颜控“、”腿控“和”手控“位居男对女外貌要求的前三位。

��第一批“00后”已经开始相亲了
网恋婚姻满意度和分手情况分析
随着互联网的发展,社交网络和在线约会的出现已经影响了婚恋的方式。John T Cacioppo 团队以美国在 2005 年至 2012 年之间结婚 19131 名受访者为样本,探究通过网络认识的夫妻对于婚姻的满意度以及分手状况。
结果表明,美国现在有超过三分之一的婚姻是从网络开始的。而与通过传统线下场所开始的婚姻相比,通过网络认识的夫妻之间婚姻破裂的可能性更小,而且婚姻满意度更高。

��核真|扎克伯格说美国1/3的婚姻是从网恋开始,美国人这么厉害的吗?
纽约时报 modern love 过往稿件分析
NYT modern love 有个栏目接受各种各样爱情故事的投稿。Quartz 的这篇数据新闻便对此栏目的过往稿件进行了大数据的分析。
数据显示,行文到末尾的时候,情感更加激烈;而到末尾的时候,“ We ”(我们)的使用更频繁。除了品味这些有趣的发现外,这篇文章也是不错的文本分析范文,以时间为轴通过用此分析情感变化。词频+时间是数据新闻处理文本的经典套路。这篇文章的启发是,除了物理时间外,文章进度也是一种时间。

分手
—
星座离婚状况不完全统计
2013 年豆瓣网友根据豆瓣话题“已离婚的你,与她/他是什么星座”中提取有性别样本 451 例,结合爱情巴士网站统计的结婚样本数据以及各星座占自然人口比例,探究“星座离婚状况”。

多少岁结婚离婚率更低?
近年离婚率持续走高,平均初婚年龄也越来越晚,多少岁结婚离婚率最低吗?作者统计 2006 年到 2010 年的婚姻有关数据,绘制出离婚率与初婚年龄的相关曲线。数据显示,29 岁结婚的离婚率最低。

婚外情“世界地图” (Ashley Madison 泄漏)
2015 年,Avid Life Media 旗下专门为已婚人士提供交友、约会服务的社交网站 Ashley Madison 网站系统遭黑客入侵,超过 3200 万用户信息泄露。
数字技术公司 Tecnilógica 利用这些数据创建了一张“世界各地婚外情情况”的世界地图,取名为 Malfideleco 。这张地图显示了Ashley Madison 用户在世界各地的分布,并从区域分布和性别方面分析了 Ashley Madison 会员的构成。
地图的原网址原网址已经失效,但通过 archive 可以原地图。
https://tecnilogica.carto.com/viz/56e702fe-4693-11e5-8f79-0e853d047bba/public_map

再看 Ashley Madison 全球用户的性别分布。Ashley Madison 全球用户约 85% 是男性,而在地图中的红点表示男性占 85% 以上的区域,黄色表示小于 85% 的区域。可以看到,大部分地区的男性用户超过 85%,但在印度颜色明显偏黄,女性用户相较其他地区占更大的比例。

另外,wired、WSJ 和 CNN 联合开发网站,在此网站,可以通过邮箱、性/名、IP 地址搜索到 Ashley Madison 会员信息数据的索引版本。

出轨规律:三年之痛,七年之痒
上个月,热播剧《三十而已》中的渣男许幻山频上热搜,遭到网友痛骂。中国人的平均出轨率是是多少?婚姻真的有“三年之痛,七年之痒”吗?
根据中国人民大学性社会学研究所的潘绥铭教授在 2000 年至 2015 年间进行全国性抽样调查中,这十五年来,中国人的平均出轨率从 2010 年的 8% 升至 2015 年的 24.3%,有明显上升。那么结婚第几年最容易出轨呢?报告显示在结婚一到三年和结婚七年两个时间段出现出轨的小高峰,这和人们常说的婚姻三年之痛七年之痒不谋而合。
那不同年龄的人如何处理对方的出轨行为?网易数读整理数份中国人出轨行为调查报告,从数据中找寻答案。

谷雨数据在今年5月20日出品有关出轨的数据新闻,从 18 个问题,通过数据解读,探讨出轨这件事。
��那些大声说我爱你的人,有多少闪了舌头劈了腿?丨谷雨数据
疫情还没结束,我们的爱情熔断了
一场新冠疫情让不少热恋情侣被迫“异地”,之前当#爱情遇上疫情 #疫情期间情侣如何谈恋爱 #疫情期间的情侣有多难 相继登上热搜,不少人感叹爱情败给了疫情。谷雨数据和数可视以此为切点,探讨疫情怎样“熔断”了爱情。
通过整理知乎上提问“为什么疫情期间很多情侣会分手”不同高赞理由的点赞数,“酒肉情侣”位居疫情分手的五大理由的榜首,获得超过 2.9 万点赞数。

关于恋爱冲突,你不得不知道的一些数字
2019 年七夕,公众号数据火锅结合发放的社会问卷调查数据和豆瓣小组讨论,探讨恋爱冲突背后的数字。
根据研究组的社会问卷调查,受访者票选出最容易破坏关系的伤害性的行为是“脾气暴躁,甚至会有暴力倾向”,其次是“不专一,和宜兴总在暧昧的边缘试探”、“有冲突不能解决,使用冷暴力”。


七夕商业数据报告
—
美团点评研究院:《浪漫经济大数据报告》
2017 年,美团点评研究院出品《浪漫经济大数据报告》,数据来源美团点评内部数据,基于 2月14日的情人节、3月14日的白色情人节、5月20日、七夕、双11、圣诞这六大“浪漫节日”当天用户数据。
数据显示,在节日当天,女性和男性搜索过节项目时差异明显,排在女性搜索前三位的分别是蛋糕、火锅和牛排;排在男性搜索的前三位的分别是鲜花、花点和牛排。有趣的是,“鲜花免费配送”的关键词排在了男性搜索的第四位。


探探:《2019年95后恋爱报告》
根据探探 2019 年发布的《2019年95后恋爱报告》,66.2% 的 95后 认为网恋是比相亲更有效的脱单方式,其中男性相比女性更相信网恋比相亲更高效。


来源:http://dydata.io/datastore/detail/1907813120693374976/
58 同城:《2019职场单身人才调研报告》
根据58同城发布的根据 20-40 岁一线、新一线城市职场单身青年调研结果整理的《2019职场单身人才调研报告》,计算机/互联网/通信行业是单身人士分布最多的行业,男性从业者中有 17.7%为单身,女性从业者中有 9.8%为单身。

今日头条:2019年中国今日头条情人节、七夕节前两周的阅读次数及阅读占比情况
今日头条 2019 年发布《大数据里的情人节:南方人比北方人更浪漫?》,基于七夕节和情人节前后的热门文章和用户阅读偏好,从读者的阅读习惯探讨大家在情人节在想些什么?
数据显示,在情人节相关文章中,“单身狗”是绕不开的关键词。

http://dydata.io/datastore/detail/1883115848491732992/
CREDIT
—
•撰文:@包小包
原标题:《七夕数据指南》