又是一年季。今年,ApacheDolphinScheduler同樣參與到了活動中來,希望有更多學生群體關注到ApacheDolphinScheduler,并踴躍參與項目共建拿獎金!
No.1活動介紹
開源之夏是由“開源軟件供應鏈點亮計劃”發起并長期支持的一項暑期開源活動,由中國科學院軟件研究所與openEuler社區共同舉辦,旨在鼓勵在校學生積極參與開源軟件的開發維護,促進優秀開源軟件社區的蓬勃發展,培養和發掘更多優秀的開發者。
學生可自主選擇感興趣的項目進行申請,并在中選后獲得社區導師親自指導。根據項目的難易程度和完成情況,參與者還將獲取開源之夏活動獎金和結項證書。
開源之夏活動官網:https://summer.iscas.ac.cn/
No.2活動日程
No.3項目介紹
ApacheDolphinScheduler是一個云原生易擴展的可視化DAG工作流任務調度系統。致力于解決數據處理流程中復雜的任務依賴關系,使各種任務類型(Spark/Flink/MR/Shell/Python/SQL等)在工作流編排中開箱即用。
No.4獎金設置
進階:獎金人民幣12000元
優化類的任務,例如提高性能,降低資源占有
基礎:獎金人民幣8000元
功能類的任務,例如為本社區開源項目增加一個或若干個重要特性等
No.5八大課題
本次活動,ApacheDolphinScheduler開源社區共設有8個項目課題具體如下,歡迎參與:
01為DolphinSchedulerPythonAPI添加資源文件
因Curve事件引發搶跑,今日產生以太坊史上最大MEV獎勵區塊:金色財經報道,以太坊核心開發者、EIP-1559聯合作者eric.eth在社交媒體上稱,今天產生了以太坊歷史上一些最大的MEV獎勵區塊。其中,Slot 6,992,273: 獲得584枚ETH獎勵;Slot 6,993,342: 獲得345枚ETH獎勵;Slot 6,992,050: 獲得247枚ETH獎勵;Slot 6,993,346: 獲得51ETH獎勵。
eric.eth稱, curve發生黑客攻擊/漏洞利用。一個機器人注意到內存池中有黑客入侵,復制了tx并在前面運行。為此,他們向區塊生產者支付大量ETH,以實現搶跑。[2023/7/31 16:08:28]
222290294
進階/Advanced
Python
目前,DolphinSchedulerPythonAPI只能傳遞字符串格式傳遞任務的參數,例如我們的tutorial
dolphinscheduler/dolphinscheduler-python/pydolphinscheduler/src/pydolphinscheduler/examples/tutorial.py
我們只將一個字符串傳遞給shell任務類型。但通常來說,用戶希望具體的執行代碼儲存在其他系統中,例如將具體文件存儲在本地文件系統、GitHub、GitLab、AmazonS3、阿里云OSS等。也許我們可以添加語法糖讓用戶更加簡單的操作外部文件
任務task_parent將從URLhttps://github.com/apache/dolphinscheduler/blob/dev/script/install.sh加載文件內容并將其傳遞給參數command,它使我們的DAG文件更容易和可維護
實現Resource的插件化
實現具體的插件Resource包括但不限于本地文件系統,GitHub,GitLab,AmazonS3,阿里云OSS
PythonAPI的通過測試覆蓋率,當前閾值為90%
CZ:沒說過幣安會取消加密貨幣交易費用:金色財經報道,針對此前網傳有關幣安將在三月份取消購買比特幣和其他加密貨幣費用的消息,幣安首席執行官CZ在社交媒體澄清道,自己沒有說過這樣的事情,或許是相關人士理解有誤并進行了錯誤傳播。[2023/3/9 12:51:37]
文檔,包括開發和使用
熟悉python,包括decorator、io、network、unittest、document
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
鐘嘉杰
聯系方式:zhongjiajie955@gmail.com
02資源中心優化
222290456
進階/Advanced
Java、Shell
重構Dolphinscheduler資源中心的讀寫邏輯
目前資源中心讀寫HDFS/S3/本地目錄通過在數據庫表中t_ds_resources記錄文件/文件夾目錄來實現文件記錄,但是在用戶初始化DS或者用戶在DS的外部修改了第三方存儲的內容的時候DS無法進行實時同步,希望能夠與第三方存儲的內容保證實時同步
DS不存儲資源中心中文件的路徑,對于資源中心的讀寫全都通過調用第三方API實現,只保存任務實例依賴到的內容路徑于數據庫用于文件刪除校驗。
實現現有的資源中心的所有功能,其中包括文件/文件夾增刪改查,任務實例調用資源中心
后端API文檔
了解Linux系統,對Linux文件管理有一定的熟悉
了解HDFS/S3組件,能夠較快速的根據官方文檔學習API的使用
熟悉Java語言
https://github.com/apache/dolphinscheduler
CoinSwitch推出“印度Web3”計劃:金色財經報道,加密貨幣交易平臺CoinSwitch宣布推出“印度Web3”計劃,旨在推動印度創業生態系統利用區塊鏈創造下一個大機會,并解決農業、農業金融、交通和記錄管理等現實問題。印度IT和工業部首席秘書Jayesh Ranjan表示,印度擁有12000多名區塊鏈開發者,是世界上數量最多的國家之一,該國Web3公司在2021籌集了49輪融資,因此希望在Web3故事中發揮關鍵作用。(telanganatoday)[2022/10/27 11:49:53]
https://github.com/apache/dolphinscheduler-website
向梓豪
聯系方式:zihaoxiang@apache.org
03master/worker/api模塊日志優化
222290457
進階/Advanced
Java
由于DS日志不方便真實定位問題,需要將打印日志進行規范及優化
整理出DS打印日志規范指導文檔,并提交到文檔庫
將master/worker/api模塊按照規范文檔進行落地并提交到開發分支
熟悉Java語言
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
進勇
聯系方式:jiny.li@foxmail.com
04自動收集、保存作業提交的Yarn作業的applicationid
222290458
進階/Advanced
Java
DolphinScheduler支持各種各樣的作業,比如Python、Shell等,其中一個很基礎的功能就是收集這些作業創建的YarnJob的applicationid。現在的實現方式是用一個正則表達式從作業的日志中解析,但這并不是一個完美的實現方式,本課題的任務就是用一種新的方式去自動收集、報錯YarnJob的applicationid信息,當然了,必須對用戶透明,即對用戶創建的作業無侵入。
Chrome瀏覽器發布緊急更新以修復新的零日漏洞:9月3日消息,Chrome瀏覽器發布105.0.5195.102(Mac、Linux和Windows)緊急版本更新,以修復新的高危零日漏洞,該漏洞代號為CVE-2022-3075,是由運行時庫集合Mojo的數據驗證不足引起的。近3個月內Chrome瀏覽器已連續多次被發現出現零日漏洞。[2022/9/3 13:06:02]
自動收集、報錯YarnJob的applicationid信息
必須對用戶透明,即對用戶創建的作業無侵入
熟悉Java,Yarn,Hive,SparkSQL,AOP
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
gabrywu
聯系方式:gabrywu@apache.org
05為DolphinScheduler添加服務初始化的工作流demo
222290459
進階/Advanced
Java、Shell
用戶在啟動DolphinScheduler服務后,可以使用demo-tool程序預置工作流demo,包括但不限于簡單的shell任務、邏輯組件任務、參數傳遞等功能,引導用戶更方便地使用DolphinScheduler。
預置工作流demo的tool程序
服務啟動腳本添加init模式
工作流demo包括但不限于shell任務、邏輯組件任務、參數傳遞等
熟悉Java、Shell
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
第一財經:有數字藏品平臺月用戶增長量在50%-80%:7月10日消息,今年以來,數字藏品熱度持續攀升,包括天貓、京東等各大互聯網平臺和文創機構紛紛入局。記者采訪業內了解到,當前數字藏品仍處在高速增長的萌芽階段,有平臺月用戶增長量在50%-80%。
此前消息,公開報告顯示,截至2022年6月中旬,國內數字藏品平臺已超過500家,5月一周工作日平均藏品發行量超過10萬件,預計2026年中國數字藏品市場規模或將超300億人民幣。(第一財經)[2022/7/10 2:03:31]
蔡順峰
聯系方式:caishunfeng2021@gmail.com
06為DolphinScheduler添加Java任務類型
222290460
進階/Advanced
Java、Shell、Vue、TypeScript
提供Java類型的調度任務,包括Jar和自定義Java代碼兩種方式,通過WEBUI定義Java運行時所需要的Resources、Libs資源文件和JVM參數,覆蓋定時任務調用Java程序場景并提升用戶方便配置。
可執行的Java類型任務插件
Java類型插件支持Jar方式,提供Resources、Libs資源文件和JVM參數的動態參數輸入
Java類型插件支持WebUI自定義Java代碼方式,提供Java類即時編譯,執行
熟悉Shell、Java、SPI、Javacompiler、VUE3、TypeScript
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
Kerwin
聯系方式:zhuangchong6@163.com
07支持測試任務
222290461
進階/Advanced
Java、Vue
目前新增/修改的工作流在上線前很難驗證工作流配置是否正確,只能通過在線上環境執行來驗證,所以有必要支持測試環境執行任務。
數據源中心支持配置測試環境源,線上環境源可綁定一個測試環境源。任務執行及工作流執行支持“是否測試”選項,選擇測試時,Worker節點在任務執行前,自動替換線上環境源為綁定的測試環境源,再配合Worker分組實現線上、測試環境的隔離,最終達到支持測試任務的目標。
數據源配置頁面增加線上、測試選項,支持綁定測試源
工作流執行頁面、任務執行頁面新增線上、測試選項
Master節點、Worker節點解析執行環境標識,替換數據源為測試數據源
工作流實例、任務實例頁面增加執行環境標識
熟悉Java、Spring、VUE3
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
溫合民
聯系方式:whm_777@163.com
08為DolphinScheduler的項目和資源中心增加讀寫權限的授權管理
222290462
基礎/Basic
Java、Vue、TypeScript
當前DolphinScheduler對于權限的管控相對比較簡單,希望在進行項目和資源中心授權時增加操作權限管控來進行讀寫權限的分離。
針對單個項目的全部內容進行讀寫權限區分,對單個用戶針對單個項目授權只讀或者讀寫權限
針對資源中心的全部內容進行讀寫權限區分,基于當前資源中心的授權內容區分出只讀或者讀寫權限
進行授權時前端頁面增加只讀和讀寫的授權操作
熟悉Java、Spring、Vue3、TypeScript
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
孫朝和
聯系方式:sunzhaohe0825@gmail.com
No.6申請參與項目
01申請資格
本活動面向年滿18周歲在校學生。
暑期即將畢業的學生,只要在申請時學生證處在有效期內,就可以提交申請。
海外學生可提供錄取通知書/學生卡/在讀證明證明學生身份。
02參與流程
03申請建議
歡迎主動向導師發送郵件進行溝通,附上自己的方案和簡歷,更加了解你~
認真了解社區項目文檔,與導師充分溝通。
歡迎加入交流群交流
參與貢獻
隨著國內開源的迅猛崛起,ApacheDolphinScheduler社區迎來蓬勃發展,為了做更好用、易用的調度,真誠歡迎熱愛開源的伙伴加入到開源社區中來,為中國開源崛起獻上一份自己的力量,讓本土開源走向全球。
參與DolphinScheduler社區有非常多的參與貢獻的方式,包括:
貢獻第一個PR(文檔、代碼)我們也希望是簡單的,第一個PR用于熟悉提交的流程和社區協作以及感受社區的友好度。
社區匯總了以下適合新手的問題列表:https://github.com/apache/dolphinscheduler/issues/5689
非新手問題列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何參與貢獻鏈接:https://dolphinscheduler.apache.org/zh-cn/docs/development/contribute.html
來吧,DolphinScheduler開源社區需要您的參與,為中國開源崛起添磚加瓦吧,哪怕只是小小的一塊瓦,匯聚起來的力量也是巨大的。
參與開源可以近距離與各路高手切磋,迅速提升自己的技能,如果您想參與貢獻,我們有個貢獻者種子孵化群,可以添加社區小助手微信(Leonard-ds),手把手教會您(貢獻者不分水平高低,有問必答,關鍵是有一顆愿意貢獻的心)。
添加小助手微信時請說明想參與貢獻。
來吧,開源社區非常期待您的參與。
活動推薦
當數據資源成為生產發展乃至于生存過程中必不可少的要素,企業該如何通過數據集成幫助企業數據服務全生命周期落地呢?5月14日,數據集成框架ApacheSeaTunnel(Incubating)將邀請一站式數據集成平臺ApacheInLong(Incubating)的技術專家與開源貢獻者們,一同來到直播間,與大家暢談使用ApacheSeaTunnel(Incubating)與ApacheInLong(Incubating)后的實踐經歷與心得體會。
直播鏈接:https://www.slidestalk.com/m/777
以太坊是一種允許智能合約和Dapps在其網絡上運行的加密貨幣。它由俄羅斯/加拿大軟件開發商VitalikButerin創建,被視為比特幣的演變.
1900/1/1 0:00:00馬斯克身家暴跌,3天蒸發210億美元,上熱搜了,大家都知道馬斯克,世界首富呀,之前因為世界首富上熱搜,現在呢又因為身價暴跌,上了熱搜,三天210億美元,合計上千億元人民幣.
1900/1/1 0:00:00近日,在工信部357批新車公示中,出現了全新一代東風本田車型的申報信息,雖然上一代車型炒得火熱但銷量平平,東風本田還是如約帶來了新一代思域兩廂版.
1900/1/1 0:00:00“青春才幾年,疫情占三年”這一句感慨在社交平臺的走紅,很大程度上反映了疫情改變了太多人的生活軌跡,也從側面反映出在互聯網語境之下中老年群體的失語.
1900/1/1 0:00:00來源:人民日報 規范職業培訓市場秩序,完善技術技能人才評價機制 推動職業培訓市場健康發展) 在就業市場上,五花八門、名目繁多的“職業技能證書”吸引了不少求職者的關注.
1900/1/1 0:00:00北京時間5月12日,比特幣經歷一輪大跌,由前一日約3.2萬美元/枚的高點一路狂泄,交易價格跌破2.7萬美元,創2020年12月以來新低,以太坊跌破1800美元,刷2021年7月以來的新低.
1900/1/1 0:00:00