云創大數據的實習崗位不僅針對在校的以及畢業的大學生,高中生也是可以的!
最近有兩名學員順利完成了云創大數據的實習課程,并各自寫了一份實習報告心得,里面比較詳實的記錄了他們的學習內容以及切身感受,我們一起來看看吧~
— 實習報告全文 —
01
2025級應屆錄取生
浙江工業大學 軟件工程專業
學生 / 卞煒正
一、引言
在信息技術飛速發展的今天,大數據與人工智能技術已成為推動各行業創新與發展的核心驅動力。我有幸獲得了在云創大數據實習的機會,這是一家在大數據存儲與智能處理領域極具影響力的企業,以數據和 AI 算法為引擎,驅動政府、教育、智能制造等領域的數字化、智能化轉型升級。此次實習,為我打開了通往大數據與人工智能世界的實踐之門。
二、崗位介紹
我在實習期間擔任數字人項目開發實習生的組員身份,主要負責運用通義千問、Qwen 等大語言模型生成文案內容,通過文字轉語音程序將文案轉化為音頻,利用 Heygem 數字人生成系統完成視頻的制作,實現從文本到數字人視頻的全流程創作。同時,深入學習數據庫的使用,通過 Python 進行數據處理與分析的實戰操作,運用 Python 爬蟲技術獲取相關數據,維護爬蟲程序的穩定運行,調用 LLM 的 api ,實現模型與其他系統的交互,并對項目中的各個端口進行統籌規劃,確保數據的流暢傳輸與系統的高效運行。
三、實習內容與成果
(一)融入數字人生成項目
數字人生成項目旨在利用先進的人工智能技術,打造高度逼真、個性化的數字人形象,應用于商業推廣。在這個過程中,我逐漸熟悉了項目的整體架構和業務流程,明確了自己在項目中的職責,也感受到了團隊成員之間緊密協作、積極進取的工作氛圍,這使我迅速融入其中,為后續工作的開展奠定了良好基礎。
(二)大模型與文案生成
Qwen 大模型在數字人生成項目中扮演著至關重要的角色,它們負責根據給定的主題和要求生成高質量的文案內容。在利用模型生成文案時,我遇到了一些挑戰,如生成的文案有時會出現邏輯不連貫、內容空洞等問題。為了解決這些問題,我深入研究了模型的參數設置和提示工程技巧,通過調整提示詞的結構、增加上下文信息、設置明確的指令等方式,引導模型生成更符合需求的文案。
(三)文字轉語音與數字人視頻生成
文字轉語音程序和 Heygem 數字人生成系統是實現數字人從文本到視頻轉化的關鍵工具。在使用 Heygem 數字人生成系統生成視頻時,也遇到了一些技術難題,如數字人的面部表情和肢體動作不夠自然、視頻合成過程中出現卡頓等。我通過深入學習 Heygem 的技術文檔和操作指南,掌握了數字人模型的參數調整方法,對數字人的面部表情和肢體動作進行精細調整,使其更加符合文案的情感表達和語境。針對視頻合成卡頓的問題,我檢查了系統的硬件配置和軟件設置,優化了視頻渲染參數,采用了分批次渲染和多線程處理等技術,提高了視頻合成的效率和穩定性。
(四)數據庫、Python 與爬蟲的學習運用
數據庫在數字人生成項目中用于存儲和管理大量的文本、音頻、視頻等數據,確保數據的安全、高效訪問。我在實習期間學習了 MySQL 數據庫的基本操作,包括數據庫的創建、表的設計、數據的插入、查詢、更新和刪除等。通過實際項目中的應用,我深刻理解了數據庫設計的重要性,學會了如何根據項目需求設計合理的數據庫結構,優化數據庫查詢語句,提高數據的讀寫性能。
Python 作為一種廣泛應用于數據處理和人工智能領域的編程語言,在項目中發揮著重要作用。我在實習前雖然對 Python 有一定的了解,但在實際項目中,面對復雜的業務邏輯和技術難題,我發現自己的知識儲備還遠遠不夠。于是,我利用業余時間系統學習了 Python 的高級特性,通過技術博客和開源項目等渠道,不斷積累 Python 編程經驗。在項目中,我運用 Python 進行數據處理和分析,編寫腳本實現數據的自動化處理和任務調度,提高了工作效率。
爬蟲技術則用于從互聯網上獲取與數字人相關的文本、圖片和視頻等數據,為數字人項目提供豐富的素材。我學習了 Python 爬蟲的基本原理和常用框架,并結合實際項目需求,編寫爬蟲程序獲取特定網站的數據。
四、實習收獲與體會
(一)專業技能提升
在云創大數據實習的這段時間,我的專業技能得到了全方位的提升。在大語言模型的應用方面,我從最初的理論學習逐漸深入到實際操作,通過不斷調整模型參數和優化提示詞,能夠更加熟練地運用Qwen 大模型生成高質量、符合業務需求的文案 。這不僅加深了我對大語言模型原理的理解,還讓我掌握了如何根據不同的應用場景靈活運用模型的技巧,例如在為不同風格的數字人視頻撰寫文案時,能夠精準地引導模型輸出相應風格的內容。
數據庫的學習與應用也讓我對數據的存儲和管理有了更深入的理解。通過學習 MySQL 數據庫的操作,我能夠根據項目需求設計合理的數據庫表結構,編寫高效的 SQL 查詢語句,實現數據的快速存儲、查詢和更新。在數字人項目中,數據庫用于存儲大量的文本、音頻和視頻數據,我通過優化數據庫查詢語句和索引設計,確保了數字人系統的穩定運行。
(二)團隊協作感悟
團隊協作是我在實習期間的另一大重要收獲。在數字人生成項目中,團隊成員來自不同的專業領域,包括算法、開發、設計等,每個人都在項目中扮演著不可或缺的角色。通過與他們的緊密合作,我深刻體會到了團隊協作的力量。經過大家的共同討論和協作,最終找到了解決問題的最佳途徑 ,提高了數字人視頻的質量和用戶體驗。
團隊合作精神的培養也是一個重要的方面。在項目遇到困難時,團隊成員之間相互支持、相互鼓勵,共同尋找解決問題的方法。在項目的攻堅階段,由于時間緊迫,任務繁重,大家都面臨著巨大的壓力。但是,團隊成員沒有退縮,而是相互協作,共同攻克了一個又一個技術難題,確保了項目的按時完成。這種團隊合作精神不僅讓我在工作中感受到了溫暖和力量,也讓我明白了在一個團隊中,只有大家心往一處想,勁往一處使,才能實現共同的目標。
五、總結與展望
回顧實習經歷,我深感充實滿足。在實踐中深化了對專業知識的理解,掌握了許多實用的技術和方法,實現了從理論到實踐的跨越。
實習過程中必不可少的是正式員工們悉心的指導和幫助。是你們的耐心教導和無私分享,讓我能夠迅速融入團隊,順利完成各項工作任務。
展望未來,大數據和人工智能領域將迎來更加廣闊的發展空間,我希望能夠繼續在這個充滿挑戰和機遇的領域深入學習和探索,不斷提升自己的專業素養和綜合能力。未來,我計劃進一步深入學習大語言模型的原理和應用,探索其在更多領域的創新應用;加強對人工智能算法和機器學習技術的研究,提升自己在模型訓練和優化方面的能力;同時,關注行業的最新動態和發展趨勢,不斷拓寬自己的技術視野,為推動技術的發展貢獻自己的一份力量。
02
南京理工大學紫金學院
軟件工程專業(專業排名前十)
大三學生 / 李鑫
一、實習崗位介紹
我深知實習對職業發展的重要性,有幸于2025年4月7日至8月14日在南京云創大數據科技股份有限公司進行了為期超四個月的Java后端開發實習。作為后端 Java 開發崗實習生,主要負責協助團隊進行后端服務的開發與維護。
具體工作包括:參與需求分析與技術方案設計,基于Spring Boot/Cloud框架開發RESTful接口;設計與優化數據庫表結構,編寫高效 SQL 語句;進行接口單元測試與集成測試;協助解決線上服務出現的技術問題;參與技術文檔編寫等。該崗位要求扎實的 Java 基礎,熟悉常用開發框架及數據庫技術,注重邏輯思維與問題解決能力。
二、實習內容及過程
實習初期,我在前輩指導下系統學習公司技術棧,包括 Spring Boot 框架核心原理、MyBatis 持久層框架應用、MySQL 數據庫優化技巧等,熟悉自研大數據平臺架構,掌握Git版本控制及代碼規范;通過參與代碼評審和文檔學習,快速掌握了公司編碼規范與開發流程,RESTFul風格開發。
中期參與公司重點項目 “智能知識圖譜” 的后端開發,負責數據集管理模塊。運用 Spring Cloud 微服務架構,設計并實現了資源查詢、上傳、統計等 多個核心接口,運用線程池加分布式鎖解決了多文件同時調用算法并把結果快速反應給前端的并發控制問題。
三、實習總結與體會
(一)實習收獲
1. 專業技能:熟練運用 Spring Boot、Spring Cloud 等框架進行微服務開發,掌握分布式事務處理、服務熔斷降級等核心技術;精通 MySQL 索引優化、SQL 調優;具備獨立進行后端接口開發、測試及問題排查的能力,技術水平達到初級開發工程師標準。
2. 工程實踐:深刻理解軟件工程中迭代開發、測試驅動等理念,參與完整的項目生命周期,掌握從需求分析到上線運維的全流程實踐經驗;熟悉自研大數據平臺架構,掌握Git版本控制及代碼規范。
3. 綜合能力:提升了跨團隊溝通協作能力,通過與前端、數據團隊的頻繁對接,學會了用清晰的技術語言表達需求;培養了問題拆解能力,面對復雜業務場景能快速定位核心問題并制定解決方案。
4. 這段實習經歷不僅豐富了我的專業知識,提高了實戰能力,更讓我在技術探索的道路上變得更加勇敢和堅定。我深知,未來的學習和工作中仍有無數未知等待我去探索和征服。我將繼續保持謙虛和勤奮,不斷學習和鉆研,為自己的職業道路打下堅實的基礎。
(二)遇到的問題及解決方法
問題 1:大文件上傳超時
現象:5GB 以上文件上傳時頻繁觸發網關超時。
解決:實現分片上傳(每片 5MB)+ 斷點續傳,前端通過 WebSocket 實時反饋進度,后端使用 Redis 記錄分片上傳狀態,最終支持 20GB 文件穩定上傳。
問題 2:文件 IO 流關閉異常
現象:高并發下偶發文件句柄泄露,導致系統無法創建新文件。
解決:采用 try-with-resources 語法強制資源釋放,結合定時任務掃描未關閉的流,通過 JVM 監控工具驗證,使句柄泄露率降為 0。
問題 3:分布式鎖失效
現象:極端情況下出現鎖超時導致的重復處理解決:實現鎖自動續期機制(watch dog),結合 ZooKeeper 實現分布式鎖降級方案,確保臨界區資源安全。
針對小文件碎片化問題,設計合并存儲策略,將小于 1MB 的文件打包存儲,減少元數據查詢次數,通過 AOP 實現接口訪問日志記錄與異常統一處理,使問題排查效率提升 50%。
(三)感悟
理論學習與工程實踐存在顯著差異,課堂上掌握的 Java 語法和數據結構知識,需要在實際開發中結合業務場景靈活運用。大數據領域的技術迭代速度遠超預期,必須保持持續學習的習慣才能跟上技術發展。團隊協作中,代碼的可讀性和可維護性比單純實現功能更重要,良好的編碼規范是提升團隊效率的基礎。
四、總結與展望
(一)總結
五個月的實習讓我從理論學習走向工程實踐,在南京云創大數據的技術氛圍中,不僅夯實了后端 Java 開發技能,更深入理解了大數據平臺的架構設計與實現邏輯。通過參與真實項目開發,將軟件工程專業所學的需求分析、系統設計、測試優化等知識轉化為實際能力,完成了從學生到準工程師的角色轉變。
(二)展望
未來將繼續深耕 Java 后端開發領域,重點學習分布式系統設計與大數據處理技術,計劃通過架構師認證提升技術深度。同時保持對行業動態的關注,將所學技術與實際業務場景結合,努力成長為兼具技術能力與業務思維的開發工程師。感謝南京云創大數據提供的實習平臺,期待未來能在技術領域持續精進,為行業發展貢獻力量。