Inference acceleration of large language models

Inference acceleration of large language models

This dissertation delves into the challenges and bottlenecks faced by current large language models during inference from three core perspectives: data, model, and system. Through meticulous research, key factors impacting inference speed are identified, encompassing data processing efficiency, m...

Saved in:

書目詳細資料
主要作者:	Zhang, Boyu
其他作者:	Mao Kezhi
格式:	Thesis-Master by Coursework
語言:	English
出版:	Nanyang Technological University 2024
主題:	Computer and Information Science Large language model Quantization Approximate computation Self-attention Transformer
在線閱讀:	https://hdl.handle.net/10356/181660
標簽:	添加標簽沒有標簽, 成為第一個標記此記錄!

相似書籍

Enhancing online safety: leveraging large language models for community moderation in Singlish dialect
由: Goh, Zheng Ying
出版: (2024)

Optimizing large language model inference
由: Shao, Siyang
出版: (2025)

Efficient inference offloading for mixture-of-experts large language models in internet of medical things
由: Yuan, Xiaoming, et al.
出版: (2024)

Heuristic development in the use of large language models for materials science
由: Chye, Vincent Zhen Guang
出版: (2024)

QuantfolioX: portfolio management application using large language model technology
由: Teo, Charlotte Xuan Qin
出版: (2024)

AIView: helping students prepare for software engineering technical interviews using large language models
由: Prasad Shubhangam Rahesh
出版: (2025)

Bias problems in large language models and how to mitigate them
由: Ong, Adrian Zhi Ying
出版: (2024)

Multi-modal large language model for drug development
由: Su, Gaoyang
出版: (2025)

Graph data query and visualization via large language models
由: Lim, Kian Yew
出版: (2025)

Reliable, efficient and light distance computation on high-dimensional vectors
由: Gao, Jianyang
出版: (2025)

Test case generation from specifications using natural language processing and large language models
由: Leung, Andrew Chun Kit
出版: (2025)

Machine translation of multilingual cybersecurity reports with large language models
由: Chua, Jaedon Boon Chong
出版: (2025)

Solution generation for university math problems using large language models
由: Wirja, Louis
出版: (2024)

Leveraging large language models and BERT for log parsing and anomaly detection
由: Zhou, Yihan, et al.
出版: (2024)

Punctuation restoration for speech transcripts using large language models
由: Liu, Changsong
出版: (2024)

MCQGen: a large language model-driven MCQ generator for personalized learning
由: Hang, Ching Nam, et al.
出版: (2024)

Exploring large language model (LLM) impacts on building energy applications
由: Wu, Mian
出版: (2025)

Model-driven smart contract generation leveraging pretrained large language models
由: Jiang, Qinbo
出版: (2024)

Financial trading in the digital age: the integration of large language model and reinforcement learning
由: Zhao, Lingxuan
出版: (2024)

Framework to evaluate and test defences against hallucination in large language model
由: Pan, Johnny Shi Han
出版: (2024)

Integrating evolutionary algorithms with large language models for enhanced problem solving
由: Hirashima Shunya
出版: (2025)

Event extraction and beyond: from conventional NLP to large language models
由: Zhou, Hanzhang
出版: (2025)

Investigating large language model pruning techniques
由: Cheng, Yixiao
出版: (2025)

Leveraging large language models for effective user interaction via conversations
由: Zhang, Mengao
出版: (2024)

Benchmarking large multimodal language models for fine-grained video understanding
由: Wu, Xinran
出版: (2025)

Transcription software with language model integration
由: Najah Ismail
出版: (2024)

Personality prediction based on large language models
由: Wee, Jewel Xin Yu
出版: (2024)

Large language model (LLM) with retrieve-augmented generation (RAG) for legal case research
由: Liu, Zihao
出版: (2024)

Empowering natural language processing in low-resource regimes
由: Feng, Zijian
出版: (2025)

Clean-label backdoor attack and defense: an examination of language model vulnerability
由: Zhao, Shuai, et al.
出版: (2025)

Genixer : Empowering multimodal Large Language Models as a powerful data generator
由: ZHAO, Henry Hengyuan, et al.
出版: (2024)

Time series task extraction from large language models
由: Toh, Leong Seng
出版: (2024)

Don’t just say “I don’t know”! Self-aligning Large Language Models for responding to unknown questions with explanations
由: DENG, Yang, et al.
出版: (2024)

A comprehensive study on optimization techniques for AMR robots recognition models
由: Zheng, Hao Peng
出版: (2025)

Transforming object-oriented Java education: harnessing large language models for enhanced learning
由: Teo, Brian Hong Guan
出版: (2025)

Skin beauty adviser assistant based on large language model and computer vision
由: Jiang, Yuwei
出版: (2025)

Large language model powered agents in the web
由: DENG, Yang, et al.
出版: (2024)

Collaborative cross-modal fusion with Large Language Model for recommendation
由: LIU, Zhongzhou, et al.
出版: (2024)

An enhanced deep reinforcement learning ensemble empowered by large language model
由: Li, Xinyi
出版: (2024)

Large language model powered agents for information retrieval
由: ZHANG, An, et al.
出版: (2024)