SXKDZ

SXKDZ

29 posts published

Python

Python 旋风之旅

Python 旋风之旅 中文翻译版 Python 官方教程的开头是这样写的:“Python 是一门既容易上手又强大的编程语言。”随着大数据、机器学习与人工智能的兴起,Python 语言正在受到越来越广泛的关注和应用。对爱好Python 的人来说,人生苦短,Python 当歌!简洁轻松的语法,开箱即用的模块,强大快乐的社区,总可以快速构建出简单高效的解决方案。对于希望快速入门 Python 语言的读者们来说,市面上众多像字典一般厚厚的 Python 书籍常常让人感到头皮发麻。为了让对 Python 语言感兴趣的读者能快速入门这门语言,而非过分纠结于Python 细枝末节之处,我们选择并翻译了这本Python 教程:A Whirlwind Tour of Python。 这本仅 100 余页的小册子是一本精简的 Python 编程入门教程,介绍了 Python 语言的核心特性以及数据科学领域内一些 Python 第三方扩展包的实际应用,目的是让熟悉其他编程语言的数据科学家快速学习 Python。

Life

20岁:Live Up to Myself

跌跌撞撞地走进了人生的第20个年头,在同济大学的时光也已经过去了快两年,终于可以不那么厚着脸皮地说,我也要进入一段崭新的生活了。 过去的一年里,时常思考自己的未来和方向,却事实上浪费了大把的时光,也许因为是倦怠,也许是欠缺深刻的自省,总之因为种种原因并没有做到当初设想的最好。记得在我20岁生日即将到来的晚上,我要做点什么、写点什么,结果一直拖到了现在。我还记得许下的愿望,因为总是操一些闲心,希望20岁以后要留更多的时间给自己。那么,明确了自己的方向,就坚定地走下去。 随着年岁增长,感觉到自己的强迫症和完美主义一直在加剧。不知道是不是因为心有不甘,但是事实的确是这样了,也经常给团队工作带来一些不愉快。Siri 倒是调侃“SXKDZ 出品,必属极品”,又想了一下,好像也没什么不对。所以,就继续坚持吧!只要付出时间和心血的事情,都要尽全力做到最好。 在新的一年里,我也打算开始我的学术之旅。上次毛哥导师来的时候介绍了人生赢家们的故事,也许对我而言暂时是遥不可及的梦想(内心还是并不希望太早进入工业界吧……),但是不管出于出国申请的压力还是拓宽知识面的需求,科研学术之路都要开始走下去。祝我好运。 在我即将20岁高龄的时候,我想祝愿自己: 让自己过得开心; 不荒废时光; 身体健康。 感谢一路以来默默关心、

写在2016年的年末
Life

写在2016年的年末

如王小波所言,生活变得越来越平淡,以前的经历能写成厚厚一本书,现在只是薄薄几页纸。回顾过去一年的生活,寥寥几笔便能概括,读书、学习。遗憾的是,这两件事情在过去一年中占的时间并不多,剩下的时间可以说都被浪费掉了。这样一想,不免觉得可惜。 在过去的一年里,也不能说完全没有收获。从这一年中经历的许多事情来看,每个人都有着不一样的追求和选择,少些不必要的争论能让生活变得快乐许多。对于我自己来说,明白自己能力和兴趣所在,是一件痛苦但是非常有意义的事情。小的时候总觉得能够成为秒天秒地秒一切的无敌少年,所以对什么事情都有着偏执的追求,当然结局往往不能如愿,最后还要为此伤感不少。现在慢慢长大了,像韩寒说的那样,我在某一方面的极限只是别人的起点。 这当然不意味着放弃。我在过去一年中学到的另外一点是,努力的终点往往应该比设想中的更远一些。说来,这是我之前嗤之以鼻的鸡汤,但是发现,事情还真的是这样。如果抱着考个“良”的想法去考高数或者大物,最后一定只有“中”。(虽然 C 和 C++ 除外,但是如果掉以轻心随手瞎搞,拿个“良”岂不成为别人口中的谈资。)只有抱着拿满分还要

Penta-Hackathon 2016 参赛总结
Hackathon

Penta-Hackathon 2016 参赛总结

11月26 - 27号参加了人生中第一次 Hackathon 类比赛,主题是 Hack for AI (both artificial intelligence and 「愛」),坐标上海闵行区紫星路999号微软亚太技术支持中心(MS APGC CSS)。 Day 0: Preparation 赛前组队可以说是一个赶鸭子上架的过程,我们 Effervesce 队的四个队员——我、毛毛、小金、一非——都是 freshmen,而且是在报名截止的当天才决定参赛,所以直到参赛之前都觉得有点虚。赛前我们开了一次组会,收集了大家的想法,决定利用微软提供的 HoloLens 开发一个入口类应用,但是由于经验不足,我们的想法显然非常 naive,在手头没有 simulator,完全不会 Unity 建模,完全不熟悉 API 的情况下一天时间上手 HoloLens

Chinese Word Segmentation

贝叶斯定理和中文分词

1 前言 1.1 中文分词问题 中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个个单独的单词,属于自然语言处理的范畴.对于中文搜索引擎而言,分词是必不可少的一个重要环节.在搜索引擎响应用户的搜索请求时,最重要的并不是呈现出所有网页结果(因为数量太过庞大),而是将与用户输入的内容最相关的内容排列在最前,这称为相关度排序.没有分词技术的出现,计算机并不会认识用户输入的句子中哪些是词语,这样搜索引擎也就无法工作. 我们知道,对于英文来说,单词是自然地以空格作为分节符,而中文却并不如此,即使有句子、段落之间的划分,我们还是无法直接找到词语与词语之间的分界符.从历史原因上分析,这是因为古代汉语除了专有名词,词语以单音词居多,并不需要特别的分词书写,而现代汉语中复音词居多,一个字不再等同于一个词.对此直观的感受是,翻译一篇文言文的字数明显多于原文. 1.2 引入:拼写纠正与贝叶斯定理 如今Word等文字处理软件都能够对用户输入不存在的单词进行纠正,比如用户输入了thew,那么他真正表达的可能是the或者they等,对拼写进行纠正就运用了贝叶斯定理.这个问题用形式化的语言描述:记\(h_{i}\)为对用户真正想输入的单词进行的假设(hypothesis)

Web Deployment

VMWare ESXi 部署以及 IP 不够时的解决方案

0x00: 背景 最近承接了学校一个内部搜索引擎的项目,学校提供了一台 ThinkServer RD430 机架式服务器,配置如下: CPU: Xeon E5-2540 @ 2.40GHz x 2 Memory: 92GB Hard Disk: 24TB 考虑到实际存储需求,需要组一个小集群来跑数据库以提高性能。我选择 VMWare vSphere 6.0 作为宿机操作系统(因为学校提供了正版),下面介绍一下部署的过程。 感谢 swx 和 2老师 的帮助。 0x01: 安装 VMWare ESXi 系统 从正规渠道获得 VMWare ESXi 系统并安装到服务器上。首先遇到的一个麻烦是这个系统不支持我校服务器的 KVM 键盘(似乎是没有驱动?),拿了一个 USB

Algorithm

算法:无向图的割点、桥与双连通分量

概念 对于无向图\(G\),删除顶点\(v\)和其相连的边后\(G\)所包含的连通分量增多,则称\(v\)为关节点 (articulation point) 或割点 (cut point)。同理,删除边\(e\)和其相连的顶点后图包含的连通分量增多,则\(e\)是割边 (cut edge) 或桥 (bridge)。 割点形式化的定义:\(A\)是割点当且仅当存在两个点\(u,v\),使得\(u\)到\(v\)的每条路径都会经过\(A\)(去掉\(A\)后,\(u\)到\(v\)没有路径)。 不含任何割点的图称为双连通图。任一无向图都可视作若干个极大双连通子图组合而成,每一个子图称为双连通分量 (bi-connected component)

Programming

趣题:程序填空一则

Samhjn在群里分享了一个问题: 请补充完成以下 C++ 程序的f函数,使得run函数得到执行。你补充的代码必须符合以下要求: 必须在一行之内完成补充的代码; 补充部分不得超过19个字符; 不能使用如下关键字、标识符或操作符:main、run、asm、#、&、*、%、/、_、(、,; 只能使用一个分号。 (Copyright ©️ Microsoft Student Club @ Wuhan University) #include <cstdio> void run(void) { printf("Hello Microsoft Student Club!\n"); return ; } int f(void) { // write your code here } int main(void) { if (f() != f(

台灣行記:太平洋的風(5)
Traveling

台灣行記:太平洋的風(5)

寫在最後 前往台灣之前對台灣很多美好的嚮往來自於韓寒較早前的一篇雜文《太平洋的風》,韓寒曾在那篇文章里表達作為一名大陸的寫作者的失落:「失落在前輩摧毀了文化、傳統美德、信任、信仰和共識」,漫步在台北的街頭他感到「我們所擁有的他們也曾擁有過,我們失去的他們留下了,我們所缺少的才是最讓人自豪的」。以我自己在台灣的15天的體會和感受,我常常會思考台灣何以成為現在的台灣,大陸何以變成為今天的大陸,兩岸之間又為何會形成如此巨大和細微的差距?事實上,我們每一個關心兩岸議題和國家發展的人又必須承認我們很難得到一個蓋棺定論的答案,因為台灣的戒嚴、解嚴、社會轉型、政黨輪替等議題進行和發展也不過五六十年,加之近年來台灣自身發展也受到了相當多的阻力,這都讓我們只能得到莫衷一是的回答。另外,稍微對台灣有過一些了解的人都會知道台灣問題的特殊,放眼整個東亞乃至全世界,其自然資源、政治制度、國內外環境和社會結構等在人類文明演化進程中很難再找到第二個例子。但是,台灣社會發展所仰賴的對於核心價值(比如自由、法治、人權等普世價值)的認同以及對多元價值和文化(比如LGBT群體)的接受和尊重仍然是整個「大中華區」的典範。 從「謝謝」說起 身為陸客來台,最開始的「不適應」發生在離開機場前往市區的大巴上。前面的乘客下車時會會對司機說一聲「謝謝」,司機也會非常開心地回答「

台灣行記:太平洋的風(4)
Traveling

台灣行記:太平洋的風(4)

Day 11:花蓮:太魯閣﹣清水斷崖﹣七星潭﹣鯉魚潭 一大早起來便趕赴火車站開始一天的遊覽行程。我們預定的是淘寶網上「易飛旗艦店」的拼車遊,報價每人95RMB。今天的行程從太魯閣國家公園開始,太魯閣國家公園位於台灣東部,內部有一條公路縱橫其中,被稱為「東西橫貫公路」。由於太魯閣公園沒有正式的大門,只在東西橫貫公路的入口處有一個石碑,因此想拍照一定要在這個石碑旁邊拍照,不然很可能全程走完都沒有意識到自己來到過太魯閣…… 太魯閣公園面積達92, 000公頃,以雄偉壯麗的大峽谷聞名。沿著公路前行,兩岸均是壁立千仞的峭壁懸崖。由於交通的原因,我們僅僅向內深入到燕子口就返回了。 第一站到達太魯閣國家公園觀看一支影片,由於園內會有落石,因此導遊專門針對安全部分進行了講解,之後行至燕子口步道我們還需要戴好安全帽。隨後進入公園的第二站是立霧溪,這條溪是整個公園主要的水流,我們到達時正值夏季,颱風剛剛過去,因此水流并沒有我們想象中的湍急、清澈,反而顯得有些渾濁,水的流速也平緩很多。在立霧溪口可以望見位於青山綠水間的長春祠,這是為了紀念修築橫貫公路的罹難者而修建的,這座長春祠已經是「第三代」,之前的兩座都因為地震遭山石毀損。由長春祠繼續前行是燕子口步道,長約2公里,往裡走不久可以看到一條銀色的瀑布從山澗流下,被稱作「銀帶瀑布」

台灣行記:太平洋的風(3)
Traveling

台灣行記:太平洋的風(3)

Day 8:墾丁浮潛、墾丁國家公園:鵝鑾鼻﹣台灣最南點﹣龍磐公園 來墾丁自然不能錯過浮潛或者深潛,墾丁潛水在各個海水浴場幾乎都提供,民宿老闆為我們推薦的地方是後壁湖。開始民俗老闆極力推薦我們去深潛,報價2500TWD一個人,相比之下浮潛只需要500TWD一個人,當時身上並沒有那麼多現金,再加上之前並沒有體驗過任何潛水的項目,於是還是選擇了浮潛。 早上用過早餐以後潛水教練來接人,後壁湖離恆春鎮非常進,開車10分鐘左右就可以到達,我們換好衣服帶好裝備以後就由教練帶著下水了。開始因為潛水眼鏡貼的不牢固差點嗆水(話說海水真咸啊……),但是慢慢適應了潛水呼吸的頻率以後就舒服很多了。在近海可以看到相當多的珊瑚礁和熱帶魚類,但是因為活動範圍比較靠進岸邊,水質比較渾濁。在後壁湖浮潛和深潛是在同一塊海域,只是深度比我們要深一些,並且攜帶了一隻氧氣瓶。據教練講深潛可以看到一些不常見的魚類。教練帶著的時間大約是30分鐘,之後可以自由活動。早晨海里還是有一些冷的,因此我們沒有呆特別久就上岸了。 浮潛完之後經過恆春老街上的「柯記綠豆蒜」吃了一碗在地特色美食,「綠豆蒜」是指綠豆剝殼以後留下的綠豆仁,之前民宿老闆特意叮囑我們要吃冰的。煮熟的綠豆蒜配上粉條、綠豆、紅豆、花生仁和桂圓等佐料,加上挫冰,再最後淋上黑糖漿,口感濃稠而不膩,非常爽口,甜度上非常合適,黑糖還散發出陣陣甘甜的氣息。

台灣行記:太平洋的風(2)
Traveling

台灣行記:太平洋的風(2)

Day 5:台中﹣台南 台中到台南直接坐台鐵即可,台南是一個更小的城市,甚至都沒有Uber可以打。在台南的主要景點是安平古堡、安平樹屋、赤崁樓、台灣文學館以及孔廟等,一天下來可以走完。 安平樹屋和安平古堡都位於安平,從市內乘坐公車可以直接到,這兩個景點都需要門票,憑藉國際學生證可以享受半價優惠。安平樹屋與書法家朱玖瑩故居合在一起為同一個園區,朱玖瑩是湖南長沙縣人,以顏體楷書最出色,先生故居內有提供毛筆以供遊客體驗書法。故居隔壁便是安平樹屋,原本是日據時期英商德記洋行大日本鹽業株式會社的辦公室與倉庫,在台灣光復之後,安平的製鹽工業開始沒落,此處也跟著荒廢,但是原有的老榕樹對其盤踞,根落而生,成為了倉庫的樑柱,其茂盛的枝葉覆蓋住了屋頂,形成房屋與老樹共生的景觀。樹屋內部設有空中觀光棧道,可以於空中俯瞰整個樹屋的景色,光陰斑駁之間景色尤為獨特,在樹屋後面還有一個小湖,可以餵魚、踩水車。 安平古堡原為荷蘭人修建,鄭成功收復台灣後改為台灣城,日據時期日人將城堡改為新式洋館。在安平古堡下有鄭成功雕像,在鄭成功陳列館中陳列著荷蘭侵略者佔據時所建熱蘭遮城的原始模型,以及鄭成功墨寶和有關史實資料,古堡上有瞭望台,是光緒年間所建。 從安平古堡返回市內後民宿房東推薦了我們一家海鮮部隊鍋的餐廳,500TWD一個鍋,分量很足,海鮮也非常新鮮。 晚上我們來到了台南的大東夜市,大東夜市每週一、

台灣行記:太平洋的風(1)
Traveling

台灣行記:太平洋的風(1)

8月1號結束為期半個月的台灣之旅,基本上完成了環島的計劃和安排。我們這次的行程是和毛毛一起,從上海出發,經由香港轉機,再飛到台北,然後沿著逆時針,依次來到台中-台南-墾丁-台東-花蓮-瑞芳,最後回到台北。 這次的行程安排因為時間有限,比較緊湊,加之台灣地形特殊,交通不便,故而行程中有相當一部分時間要花費在交通上,因此很多地方只能走馬觀花地看看。但是總體來說,我和毛毛都對這次台灣之行感到滿意,台灣之美,不僅是雄奇壯麗的自然風光,更在乎于人文景觀。在體驗了15天的台灣生活回到大陸過後不免感到一絲失落。千百年來兩岸同源共生,卻在各自短短50多年的發展後變得差異巨大,這也更讓我們感到唏噓。 行前準備 證件 台灣自由行首先需要大陸居民前往台灣通行證(簡稱「大通證」)、中華民國出入台灣地區通行證(簡稱「入台證」),另外,學生可以另外申請國際學生證,在台灣的許多景點、酒店等可以享受到學生折扣。 住宿 台灣住宿以各式民宿為特色,出於省錢和交朋友,也可以考慮選擇背包客客棧。找房源推薦AirBnB(酒店和民宿, Get 133RMB via